KR101871739B1 - Method of determining representative keyword of application and system for determining representative keyword of application - Google Patents

Method of determining representative keyword of application and system for determining representative keyword of application Download PDF

Info

Publication number
KR101871739B1
KR101871739B1 KR1020180049073A KR20180049073A KR101871739B1 KR 101871739 B1 KR101871739 B1 KR 101871739B1 KR 1020180049073 A KR1020180049073 A KR 1020180049073A KR 20180049073 A KR20180049073 A KR 20180049073A KR 101871739 B1 KR101871739 B1 KR 101871739B1
Authority
KR
South Korea
Prior art keywords
keywords
target application
applications
determining
keyword
Prior art date
Application number
KR1020180049073A
Other languages
Korean (ko)
Inventor
김찬웅
허승필
Original Assignee
주식회사 텐디
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 주식회사 텐디 filed Critical 주식회사 텐디
Priority to KR1020180049073A priority Critical patent/KR101871739B1/en
Application granted granted Critical
Publication of KR101871739B1 publication Critical patent/KR101871739B1/en
Priority to PCT/KR2018/008121 priority patent/WO2019208872A1/en

Links

Images

Classifications

    • G06F17/30864
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • G06F17/2755

Abstract

The present invention relates to a method for determining a representative keyword of an application, which comprises the steps of: crawling description data of a plurality of applications from an application market; determining keywords included in the description data and the importance of the keywords in the description data to store the same in a first database, with respect to each of the applications; selecting a target application among the applications; obtaining a list of associated applications having a high correlation with the target application among the applications; reading each keyword of the target application and the associated applications and the importance of the keywords from the first database; determining the keywords of the target application overlapping with the keywords of the associated applications, as redundant keywords; and determining representative keywords representing the target application among the keywords of the target application on the basis of the importance of the keywords of the target application and the importance of the redundant keywords of each of the associated applications.

Description

어플리케이션의 대표 키워드 결정 방법 및 어플리케이션의 대표 키워드 결정 시스템 {METHOD OF DETERMINING REPRESENTATIVE KEYWORD OF APPLICATION AND SYSTEM FOR DETERMINING REPRESENTATIVE KEYWORD OF APPLICATION}BACKGROUND OF THE INVENTION 1. Field of the Invention [0001] The present invention relates to a representative keyword determination method for an application, and a representative keyword determination system for an application. [0002]

본 발명은 모바일 어플리케이션을 대표하는 키워드를 분석하는 기술에 관한 것으로, 보다 상세하게는 어플리케이션의 대표 키워드 결정 방법 및 어플리케이션의 대표 키워드 결정 시스템에 관한 것이다.BACKGROUND OF THE INVENTION 1. Field of the Invention [0002] The present invention relates to a technique for analyzing keywords representing mobile applications, and more particularly, to a representative keyword determination method for an application and a representative keyword determination system for an application.

최근 스마트폰, 태블릿 PC 등과 같은 모바일 단말기의 성능이 향상되고 무선 통신 속도가 증가함에 따라 모바일 단말기에서 실행될 수 있는 어플리케이션의 종류가 급격히 증가하고 있다.Recently, as the performance of mobile terminals such as smart phones and tablet PCs has improved and wireless communication speeds have increased, the kinds of applications that can be executed in mobile terminals have been rapidly increasing.

따라서 모바일 단말기 사용자들은 수많은 어플리케이션들 중에서 자신이 원하는 어플리케이션을 찾기가 점점 어려워지고 있다.Therefore, it is increasingly difficult for mobile terminal users to find an application desired by a user among a large number of applications.

이에, 어플리케이션 개발 회사나 어플리케이션을 판매하는 오픈 마켓은 어플리케이션의 성격, 특징, 기능 등을 나타내는 설명 자료를 어플리케이션과 함께 제공하고 있다.Therefore, Open Market, which sells application development companies and applications, provides explanatory materials showing the characteristics, characteristics, and functions of applications with applications.

또한, 최근 어플리케이션을 판매하는 오픈 마켓에서는 어플리케이션들을 종류에 따라 복수의 카테고리들로 분류하고, 어플리케이션의 카테고리 정보를 어플리케이션의 설명 자료와 함께 사용자에게 제공함으로써 사용자의 어플리케이션 검색 편의성을 향상시키고자 노력하고 있다.In an open market for selling applications, recently, applications are classified into a plurality of categories according to their types, and category information of an application is provided to a user together with explanatory data of the application, thereby making it easy to improve user's convenience of searching for an application .

그러나, 사용자는 어플리케이션의 카테고리 정보만으로는 어플리케이션의 특징이나 기능에 대해 파악하기가 어렵고, 자신이 원하는 어플리케이션을 찾기 위해 다양한 어플리케이션들의 설명 자료를 읽어 봄으로써 어플리케이션들의 특징이나 기능을 파악하는 데에도 많은 시간과 노력이 필요하다는 문제점이 있다.However, it is difficult for the user to understand the characteristics and functions of the application only by the category information of the application. Also, by reading explanatory data of various applications to find the application desired by the user, There is a problem that effort is required.

상기와 같은 문제점을 해결하기 위한 본 발명의 일 목적은 모바일 어플리케이션의 특징을 효과적으로 나타낼 수 있는 어플리케이션의 대표 키워드들을 결정하는 방법 및 시스템을 제공하는 것이다.SUMMARY OF THE INVENTION It is an object of the present invention to provide a method and system for determining representative keywords of an application that can effectively represent a feature of a mobile application.

상술한 본 발명의 일 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 방법에서, 어플리케이션 마켓으로부터 복수의 어플리케이션들 각각의 설명 자료를 크롤링(crawling)하고, 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 제1 데이터베이스에 저장하고, 상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택하고, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하고, 상기 제1 데이터베이스로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 상기 키워드들 및 상기 키워드들의 비중들을 독출하고, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 연관 어플리케이션들의 상기 키워드들과 중복되는 키워드들을 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정한다.In order to accomplish one object of the present invention, in a representative keyword determination method of an application according to an embodiment of the present invention, crawling description data of each of a plurality of applications from an application market, For each of the plurality of applications, the weight of the keywords in the keywords included in the explanatory data and the explanatory data is determined and stored in the first database, the target application is selected from among the plurality of applications, Obtaining a list of associated applications having a high degree of association with the target application, reading the weight of the keywords and the keywords of each of the target application and the associated applications from the first database, Determining, based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications, determining keywords that overlap with the keywords of the related applications among the keywords of the target applications, And determines representative keywords representing the target application from among the keywords of the target application.

일 실시예에 있어서, 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 상기 키워드들 및 상기 설명 자료에서 상기 키워드들의 상기 비중들을 결정하여 상기 제1 데이터베이스에 저장하는 단계는, 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 대해 형태소 분석(morphological analysis)을 수행하여 상기 설명 자료에 포함되는 상기 키워드들을 추출하는 단계, 상기 설명 자료에서 상기 키워드들 각각의 반복 횟수를 결정하는 단계, 상기 키워드들 각각의 상기 반복 횟수를 상기 키워드들의 상기 반복 횟수들의 총합으로 나눈 값을 상기 키워드들 각각의 상기 비중으로 결정하는 단계, 및 상기 키워드들 및 상기 키워드들의 상기 비중들을 상응하는 어플리케이션의 명칭과 연관시켜 상기 제1 데이터베이스에 저장하는 단계를 포함할 수 있다.In one embodiment, for each of the plurality of applications, the step of determining the weight of the keywords in the keywords and the explanatory data included in the explanatory data and storing the determined weight in the first database may include: Performing morphological analysis on the explanatory data for each of the applications to extract the keywords included in the explanatory data; determining a repetition frequency of each of the keywords in the explanatory data; Determining, by the weight of each of the keywords, a value obtained by dividing the repetition count of each of the keywords by the sum of the repetition counts of the keywords, and associating the weight of the keywords and the keywords with the name of the corresponding application To the first database It can be included.

일 실시예에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는, 상기 복수의 어플리케이션들 각각에 대하여, 상응하는 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 미리 저장하는 제2 데이터베이스로부터 상기 목표 어플리케이션에 상응하는 상기 연관 어플리케이션들의 목록을 독출하는 단계를 포함할 수 있다.In one embodiment, the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications may include, for each of the plurality of applications, And reading a list of the associated applications corresponding to the target application from a second database that stores a list of the associated applications in advance.

일 실시예에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는, 복수의 모바일 단말기들 각각의 식별 아이디 및 상기 복수의 모바일 단말기들 각각에 설치된 어플리케이션들의 목록을 포함하는 설치 로그 데이터를 수신하여 제3 데이터베이스에 저장하는 단계, 상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들 중에서 제1 내지 제k(k는 양의 정수) 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 전체 비율들을 결정하는 단계, 상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 교차 비율들을 결정하는 단계, 상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들을 결정하는 단계, 및 상기 제1 내지 제k 어플리케이션들 중에서 상대적으로 높은 연관 지수를 갖는 어플리케이션들을 상기 연관 어플리케이션들로 결정하는 단계를 포함할 수 있다.In one embodiment, the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications comprises the steps of: obtaining an identification ID of each of the plurality of mobile terminals, Receiving install log data including a list of installed applications and storing the received install log data in a third database, storing installation log data including a list of installed applications in a first database, Determining k-th total ratios corresponding to the ratios of mobile terminals in which each k-th (k is a positive integer) application is installed; Based on the target application Determining k-th intersection ratios corresponding to ratios of mobile terminals in which each of the first to k-th applications is installed among mobile terminals with installed first to k-th applications, Determining k-th association indices indicative of a degree of association between the target application and each of the first to k-th applications based on the k-th to k-th crossing ratios, Determining the applications with a relatively high association index as the associated applications.

상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 상기 제1 내지 제k 전체 비율들을 결정하는 단계는, 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 전체 개수로 결정하는 단계, 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 제j(j는 1 이상 k 이하의 임의의 양의 정수) 어플리케이션이 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 제j 설치 개수로 결정하는 단계, 및 상기 제j 설치 개수를 상기 전체 개수로 나눈 값을 제j 전체 비율로 결정하는 단계를 포함할 수 있다.The first to kth applications corresponding to the ratios of mobile terminals installed with the first to k-th applications among the plurality of mobile terminals, based on the installation log data of the plurality of mobile terminals stored in the third database, Determining all ratios includes determining a total number of the identification IDs corresponding to the plurality of mobile terminals based on the installation log data of the plurality of mobile terminals, Determining, as a j-th installation number, the number of identification IDs corresponding to mobile terminals having a j-th application (where j is any positive integer equal to or greater than 1 k) based on installation log data; and Determining the value obtained by dividing the installation number by the total number as the total j ratio System.

상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 상기 제1 내지 제k 교차 비율들을 결정하는 단계는, 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 목표 설치 개수로 결정하는 단계, 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션과 제j(j는 1 이상 k 이하의 임의의 양의 정수) 어플리케이션이 함께 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 제j 교차 개수로 결정하는 단계, 및 상기 제j 교차 개수를 상기 목표 설치 개수로 나눈 값을 제j 교차 비율로 결정하는 단계를 포함할 수 있다.The first to the kth applications corresponding to the ratio of the mobile terminals installed with the first to k-th applications among the mobile terminals installed with the target application on the basis of the installation log data of the plurality of mobile terminals stored in the third database, Determining the kth intersection ratios comprises: determining a number of the identification IDs corresponding to mobile terminals on which the target application is installed based on the installation log data of the plurality of mobile terminals as a target installation number, Based on the installation log data of the mobile terminals of the mobile terminals of the mobile terminals, the number of the identification IDs corresponding to the mobile terminals in which the target application and the j (j is an arbitrary positive integer equal to or greater than 1) Determining a number, Wherein the j-th cross-number can include determining a value obtained by dividing the number of target installed in the j-th cross ratio.

상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는, 상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함할 수 있다.The first through k-th associative exponents representing the degree of association between the target application and each of the first through k-th applications based on the first through k-th overall ratios and the first through k- Determining may comprise determining the first to k < RTI ID = 0.0 > k < / RTI > associated exponents based on a difference between each of the first through k total ratios and each of the first through k crossings ratios.

상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는, 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함할 수 있다.The first through k-th associative exponents representing the degree of association between the target application and each of the first through k-th applications based on the first through k-th overall ratios and the first through k- The determining may comprise determining the first through k k -th associative exponents based on a ratio of each of the first through k-th crossing ratios for each of the first through k-th overall ratios.

상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는, 상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이 및 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함할 수 있다.The first through k-th associative exponents representing the degree of association between the target application and each of the first through k-th applications based on the first through k-th overall ratios and the first through k- Determining the difference between each of said first through kth total ratios and each of said first through kth intersection ratios and said first through kth intersection ratios for each of said first through k total ratios, K < / RTI > associated indexes based on the ratio of each of the first through k < th >

상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는, 상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이, 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율, 및 0보다 크고 1보다 작은 값을 갖는 가중치에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함할 수 있다.The first through k-th associative exponents representing the degree of association between the target application and each of the first through k-th applications based on the first through k-th overall ratios and the first through k- Determining a difference between each of said first through kth total ratios and each of said first through kth intersection ratios, said first through kth intersection ratios for each of said first through kth total ratios, , And determining the first through k < RTI ID = 0.0 > k < / RTI > associated exponents based on a weight having a ratio of each of the first through k and a value greater than zero and less than one.

일 실시예에 있어서, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중을 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드가 아닌 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중을 상기 비중복 키워드의 점수로 결정하는 단계, 및 상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함할 수 있다.In one embodiment, the representative keywords representing the target application among the keywords of the target application are determined based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications For each of the duplicate keywords among the keywords of the target application, applying a weight of the duplicate keyword of each of the associated applications to a weight of the duplicate keyword of the target application as a weight, Determining a score of the non-overlapping keyword in the target application for each of the non-overlapping keywords that are not duplicate keywords among the keywords in the target application System, and it can include determining a keyword having a relatively high score among the keyword of the target application with the representative keywords.

상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중을 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계는, 상기 연관 어플리케이션들의 상기 중복 키워드의 비중들의 합을 상기 목표 어플리케이션의 상기 중복 키워드의 비중과 합한 값을 상기 중복 키워드의 점수로 결정하는 단계를 포함할 수 있다.For each of the duplicate keywords among the keywords of the target application, a weight of the duplicate keyword is determined by applying a weight of the duplicate keyword of each of the associated applications to a weight of the duplicate keyword of the target application May include determining a sum of the weights of the duplicate keywords of the associated applications and a specific gravity of the duplicate keywords of the target application as a score of the duplicate keyword.

일 실시예에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 상대적으로 높은 연관도를 갖는 어플리케이션들에 상응하는 상기 연관 어플리케이션들의 목록 및 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들을 획득하는 단계를 포함할 수 있다.In one embodiment, the step of acquiring a list of the associated applications having a high degree of association with the target application among the plurality of applications may include acquiring, from among the plurality of applications, Obtaining a list of the associated applications corresponding to the target application and associated indexes representing the degree of association between the target application and the associated applications.

상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중 및 상기 연관 어플리케이션들 각각의 상기 연관 지수를 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드가 아닌 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중을 상기 비중복 키워드의 점수로 결정하는 단계, 및 상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함할 수 있다.Wherein the step of determining the representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the overlapping keywords of each of the associated applications, For each of the duplicate keywords among the keywords of the application, the weight of the duplicate keyword of each of the associated applications and the association index of each of the associated applications is applied as a weight to the weight of the duplicate keyword of the target application Determining a score of the duplicate keyword, calculating, for each of the non-duplicated keywords that are not duplicate keywords among the keywords of the target application, Determining a score of the keyword clothing, and may include determining keywords having a relatively high score among the keyword of the target application with the representative keywords.

상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중 및 상기 연관 어플리케이션들 각각의 상기 연관 지수를 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계는, 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중과 상기 연관 어플리케이션들 각각의 상기 연관 지수의 곱을 상기 목표 어플리케이션의 상기 중복 키워드의 비중과 합한 값을 상기 중복 키워드의 점수로 결정하는 단계를 포함할 수 있다.For each of the duplicate keywords among the keywords of the target application, a weight of the duplicate keyword of each of the associated applications and a weight of the association index of each of the associated applications in the weight of the duplicate keyword of the target application Wherein the step of determining the score of the duplicate keyword comprises: calculating a sum of the weight of the duplicate keyword of each of the associated applications and the association index of each of the associated applications together with the specific gravity of the duplicate keyword of the target application, As a score of a duplicate keyword.

일 실시예에 있어서, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 점수를 결정하는 단계, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 계수를 결정하는 단계, 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 점수에 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 점수로 결정하는 단계, 및 상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함할 수 있다.In one embodiment, the representative keywords representing the target application among the keywords of the target application are determined based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications Determining a score for each of the keywords in the target application based on the weight of the keywords in the target application and the weight of the duplicate keywords in each of the associated applications, Determining a correction coefficient for each of the keywords of the target application based on the number of applications including keywords overlapping each of the keywords of the target application, Of the target application by the correction coefficient of each of the keywords of the target application as the correction score of each of the keywords of the target application, And determining the keywords having the correction score as the representative keywords.

상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 결정하는 단계는, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 작은 값으로 결정하는 단계, 및 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 큰 값으로 결정하는 단계를 포함할 수 있다.The step of determining the correction coefficient of each of the keywords of the target application based on the number of applications including a keyword overlapping each of the keywords of the target application among the plurality of applications comprises: Determining the correction coefficient of the keyword of the target application to be a relatively small value when the number of applications including the same keyword as the keyword of the target application is relatively large among the plurality of applications, Determining the correction coefficient of the keyword of the target application as a relatively large value when the number of applications including the same keyword as the keyword of the target application is relatively small, .

일 실시예에 있어서, 상기 어플리케이션의 대표 키워드 결정 방법은 상기 복수의 어플리케이션들 각각의 상기 설명 자료에 기초하여 상기 복수의 어플리케이션들 각각의 카테고리 정보를 상기 제1 데이터베이스에 저장하는 단계를 더 포함할 수 있다. 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 점수를 결정하는 단계, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 계수를 결정하는 단계, 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 점수에 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 점수로 결정하는 단계, 및 상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함할 수 있다.In one embodiment, the representative keyword determination method of the application may further include storing category information of each of the plurality of applications in the first database based on the description data of each of the plurality of applications have. Wherein the step of determining the representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the overlapping keywords of each of the associated applications, Determining a score of each of the keywords in the target application based on the weight of the keywords in the application and the weight of the duplicate keywords in each of the associated applications; Determining a correction coefficient for each of the keywords of the target application based on the number of categories to which the applications that contain the keywords overlap each other, Of the target application by the correction coefficient of each of the keywords of the target application as the correction score of each of the keywords of the target application, And determining the keywords having the correction score as the representative keywords.

상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 결정하는 단계는, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 작은 값으로 결정하는 단계, 및 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 큰 값으로 결정하는 단계를 포함할 수 있다.The step of determining the correction coefficient of each of the keywords of the target application based on the number of categories to which the applications including the keywords overlapping each of the keywords of the target application among the plurality of applications belongs, Determining the correction coefficient of the keyword of the target application to be a relatively small value when the number of categories to which the applications including the same keyword as the keyword of the target application belongs is relatively large among the applications of the target application, When the number of categories to which the applications including the same keyword as the keyword of the target application among the plurality of applications belongs is relatively small, The correction coefficient of the word may include the step of relatively the greater the value.

상술한 본 발명의 일 목적을 달성하기 위하여, 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 시스템은 데이터베이스, 설명 자료 수집부, 키워드 추출부, 연관 어플리케이션 결정부, 및 키워드 분석부를 포함한다. 상기 설명 자료 수집부는 어플리케이션 마켓으로부터 복수의 어플리케이션들 각각의 설명 자료를 크롤링(crawling)한다. 상기 키워드 추출부는 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 상기 데이터베이스에 저장한다. 상기 연관 어플리케이션 결정부는 상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택하고, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득한다. 상기 키워드 분석부는 상기 데이터베이스로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 상기 키워드들 및 상기 키워드들의 비중들을 독출하고, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 연관 어플리케이션들의 상기 키워드들과 중복되는 키워드들을 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정한다.In order to accomplish one object of the present invention, a representative keyword determination system of an application according to an embodiment of the present invention includes a database, a description data collection unit, a keyword extraction unit, an associated application determination unit, and a keyword analysis unit. The description data collection unit crawls description data of each of a plurality of applications from an application market. The keyword extracting unit determines the specific weight of the keywords in the description data and the description data for each of the plurality of applications and stores the determined weight in the database. The associated application determination unit selects a target application among the plurality of applications, and acquires a list of related applications having a high degree of association with the target application among the plurality of applications. Wherein the keyword analyzing unit reads the weightings of the keywords and the keywords of each of the target application and the related applications from the database and stores keywords overlapping the keywords of the related applications among the keywords of the target application Determines representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications .

본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들을 정확하게 결정할 수 있다.The representative keyword determination system of the application and the representative keyword determination method of the application according to the embodiments of the present invention can accurately determine the representative keywords that effectively characterize the application.

도 1은 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 시스템을 나타내는 도면이다.
도 2는 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 방법을 나타내는 순서도이다.
도 3은 도 2의 복수의 어플리케이션들 각각에 대하여, 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 제1 데이터베이스에 저장하는 단계의 일 예를 나타내는 순서도이다.
도 4는 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제1 데이터베이스의 일 예를 나타내는 도면이다.
도 5는 도 1에 도시된 어플리케이션의 대표 키워드 결정 시스템의 일 예를 나타내는 도면이다.
도 6은 도 5의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제2 데이터베이스의 일 예를 나타내는 도면이다.
도 7은 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 연관 어플리케이션 결정부의 일 예를 나타내는 블록도이다.
도 8은 도 2의 복수의 어플리케이션들 중에서 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 단계의 일 예를 나타내는 순서도이다.
도 9는 도 7에 도시된 복수의 모바일 단말기들 각각으로부터 연관 어플리케이션 결정부로 전송되는 설치 로그 데이터의 일 예를 나타내는 도면이다.
도 10은 도 7의 연관 어플리케이션 결정부에 포함되는 제3 데이터베이스의 일 예를 나타내는 도면이다.
도 11은 도 8의 복수의 모바일 단말기들 중에서 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 전체 비율들을 결정하는 단계의 일 예를 나타내는 순서도이다.
도 12는 도 8의 목표 어플리케이션이 설치된 모바일 단말기들 중에서 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 교차 비율들을 결정하는 단계의 일 예를 나타내는 순서도이다.
도 13은 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계의 일 예를 나타내는 순서도이다.
도 14는 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계의 다른 예를 나타내는 순서도이다.
도 15는 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계의 또 다른 예를 나타내는 순서도이다.
도 16은 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계의 또 다른 예를 나타내는 순서도이다.
도 17은 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제1 데이터베이스의 다른 예를 나타내는 도면이다.
1 is a diagram illustrating a representative keyword determination system of an application according to an exemplary embodiment of the present invention.
2 is a flowchart illustrating a representative keyword determination method of an application according to an embodiment of the present invention.
FIG. 3 is a flowchart illustrating an example of determining the weight of the keywords in the description data and the keywords in the description data for each of the plurality of applications in FIG. 2 and storing the determined weight in the first database.
4 is a diagram showing an example of a first database included in the representative keyword determination system of the application of FIG.
5 is a diagram showing an example of a representative keyword determination system of the application shown in FIG.
6 is a diagram showing an example of a second database included in the representative keyword determination system of the application of FIG.
7 is a block diagram showing an example of an associated application determination unit included in the representative keyword determination system of the application shown in FIG.
FIG. 8 is a flowchart showing an example of a step of acquiring a list of associated applications having a high degree of association with a target application among the plurality of applications of FIG. 2. FIG.
9 is a diagram illustrating an example of installation log data transmitted from each of a plurality of mobile terminals shown in FIG. 7 to an associated application determination unit.
10 is a diagram showing an example of a third database included in the associated application determination unit of FIG.
FIG. 11 is a flowchart showing an example of determining the first to k-th overall ratios corresponding to the ratios of mobile terminals in which each of the first to k-th applications among the plurality of mobile terminals in FIG. 8 is installed.
FIG. 12 is a flowchart showing an example of determining the first through k-th intersection ratios corresponding to the ratios of the mobile terminals installed with the first through k-th applications among the mobile terminals installed with the target application of FIG.
13 shows an example of a step of determining representative keywords representing the target application among the keywords of the target application on the basis of the weight of the keywords of the target application and the weight of the duplicate keywords of each of the related applications Fig.
14 shows another example of the step of determining representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the related applications Fig.
FIG. 15 is a flowchart illustrating a method for determining representative keywords representative of the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of duplicate keywords of each of the related applications Fig.
FIG. 16 is a flowchart illustrating a process of determining representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of duplicate keywords of each of the related applications, Fig.
17 is a diagram showing another example of the first database included in the representative keyword determination system of the application of FIG.

본문에 개시되어 있는 본 발명의 실시예들에 대해서, 특정한 구조적 내지 기능적 설명들은 단지 본 발명의 실시예를 설명하기 위한 목적으로 예시된 것으로, 본 발명의 실시예들은 다양한 형태로 실시될 수 있으며 본문에 설명된 실시예들에 한정되는 것으로 해석되어서는 아니 된다.For the embodiments of the invention disclosed herein, specific structural and functional descriptions are set forth for the purpose of describing an embodiment of the invention only, and it is to be understood that the embodiments of the invention may be practiced in various forms, The present invention should not be construed as limited to the embodiments described in Figs.

본 발명은 다양한 변경을 가할 수 있고 여러 가지 형태를 가질 수 있는바, 특정 실시예들을 도면에 예시하고 본문에 상세하게 설명하고자 한다. 그러나 이는 본 발명을 특정한 개시 형태에 대해 한정하려는 것이 아니며, 본 발명의 사상 및 기술 범위에 포함되는 모든 변경, 균등물 내지 대체물을 포함하는 것으로 이해되어야 한다.The present invention is capable of various modifications and various forms, and specific embodiments are illustrated in the drawings and described in detail in the text. It is to be understood, however, that the invention is not intended to be limited to the particular forms disclosed, but on the contrary, is intended to cover all modifications, equivalents, and alternatives falling within the spirit and scope of the invention.

제1, 제2 등의 용어는 다양한 구성요소들을 설명하는데 사용될 수 있지만, 상기 구성요소들은 상기 용어들에 의해 한정되어서는 안 된다. 상기 용어들은 하나의 구성요소를 다른 구성요소로부터 구별하는 목적으로 사용될 수 있다. 예를 들어, 본 발명의 권리 범위로부터 이탈되지 않은 채 제1 구성요소는 제2 구성요소로 명명될 수 있고, 유사하게 제2 구성요소도 제1 구성요소로 명명될 수 있다.The terms first, second, etc. may be used to describe various components, but the components should not be limited by the terms. The terms may be used for the purpose of distinguishing one component from another. For example, without departing from the scope of the present invention, the first component may be referred to as a second component, and similarly, the second component may also be referred to as a first component.

어떤 구성요소가 다른 구성요소에 "연결되어" 있다거나 "접속되어" 있다고 언급된 때에는, 그 다른 구성요소에 직접적으로 연결되어 있거나 또는 접속되어 있을 수도 있지만, 중간에 다른 구성요소가 존재할 수도 있다고 이해되어야 할 것이다. 반면에, 어떤 구성요소가 다른 구성요소에 "직접 연결되어" 있다거나 "직접 접속되어" 있다고 언급된 때에는, 중간에 다른 구성요소가 존재하지 않는 것으로 이해되어야 할 것이다. 구성요소들 간의 관계를 설명하는 다른 표현들, 즉 "~사이에"와 "바로 ~사이에" 또는 "~에 이웃하는"과 "~에 직접 이웃하는" 등도 마찬가지로 해석되어야 한다.It is to be understood that when an element is referred to as being "connected" or "connected" to another element, it may be directly connected or connected to the other element, . On the other hand, when an element is referred to as being "directly connected" or "directly connected" to another element, it should be understood that there are no other elements in between. Other expressions that describe the relationship between components, such as "between" and "between" or "neighboring to" and "directly adjacent to" should be interpreted as well.

본 출원에서 사용한 용어는 단지 특정한 실시예를 설명하기 위해 사용된 것으로, 본 발명을 한정하려는 의도가 아니다. 단수의 표현은 문맥상 명백하게 다르게 뜻하지 않는 한, 복수의 표현을 포함한다. 본 출원에서, "포함하다" 또는 "가지다" 등의 용어는 설시된 특징, 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것이 존재함을 지정하려는 것이지, 하나 또는 그 이상의 다른 특징들이나 숫자, 단계, 동작, 구성요소, 부분품 또는 이들을 조합한 것들의 존재 또는 부가 가능성을 미리 배제하지 않는 것으로 이해되어야 한다.The terminology used in this application is used only to describe a specific embodiment and is not intended to limit the invention. The singular expressions include plural expressions unless the context clearly dictates otherwise. In the present application, the terms "comprise", "having", and the like are intended to specify the presence of stated features, integers, steps, operations, elements, components, or combinations thereof, , Steps, operations, components, parts, or combinations thereof, as a matter of principle.

다르게 정의되지 않는 한, 기술적이거나 과학적인 용어를 포함해서 여기서 사용되는 모든 용어들은 본 발명이 속하는 기술 분야에서 통상의 지식을 가진 자에 의해 일반적으로 이해되는 것과 동일한 의미이다. 일반적으로 사용되는 사전에 정의되어 있는 것과 같은 용어들은 관련 기술의 문맥상 가지는 의미와 일치하는 의미인 것으로 해석되어야 하며, 본 출원에서 명백하게 정의하지 않는 한, 이상적이거나 과도하게 형식적인 의미로 해석되지 않는다.Unless otherwise defined, all terms used herein, including technical or scientific terms, have the same meaning as commonly understood by one of ordinary skill in the art to which this invention belongs. Terms such as those defined in commonly used dictionaries should be construed as meaning consistent with meaning in the context of the relevant art and are not to be construed as ideal or overly formal in meaning unless expressly defined in the present application .

이하, 첨부한 도면들을 참조하여, 본 발명의 바람직한 실시예를 보다 상세하게 설명하고자 한다. 도면상의 동일한 구성요소에 대해서는 동일한 참조부호를 사용하고 동일한 구성요소에 대해서 중복된 설명은 생략한다.Hereinafter, preferred embodiments of the present invention will be described in detail with reference to the accompanying drawings. The same reference numerals are used for the same constituent elements in the drawings and redundant explanations for the same constituent elements are omitted.

도 1은 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 시스템을 나타내는 도면이다.1 is a diagram illustrating a representative keyword determination system of an application according to an exemplary embodiment of the present invention.

도 1을 참조하면, 어플리케이션의 대표 키워드 결정 시스템(10)은 설명 자료 수집부(100), 키워드 추출부(200), 제1 데이터베이스(DB1)(300), 연관 어플리케이션 결정부(400), 및 키워드 분석부(500)를 포함한다.Referring to FIG. 1, a representative keyword determination system 10 of an application includes an explanation data collection unit 100, a keyword extraction unit 200, a first database DB1 300, an association application determination unit 400, And a keyword analysis unit 500.

일반적으로 어플리케이션들을 제공하는 어플리케이션 마켓(20)은 어플리케이션들의 특징, 기능 등을 기술하는 설명 자료(DS)를 함께 제공한다.The application market 20, which generally provides applications, provides explanatory materials (DS) describing the features, functions, etc. of the applications.

어플리케이션의 대표 키워드 결정 시스템(10)은 유무선 통신을 통해 어플리케이션 마켓(20)으로부터 복수의 어플리케이션들 각각의 설명 자료(DS)를 크롤링(crawling)하고, 상기 복수의 어플리케이션들 각각의 설명 자료(DS)를 분석하여 상기 복수의 어플리케이션들 각각을 대표하는 대표 키워드들(REP_KWs)을 결정한다.The representative keyword determination system 10 of the application crawls description data DS of each of a plurality of applications from the application market 20 via wired or wireless communication and stores description data DS of each of the plurality of applications, And determines representative keywords (REP_KWs) representative of each of the plurality of applications.

이 때, 후술하는 바와 같이, 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 복수의 어플리케이션들 각각에 대해 상기 복수의 어플리케이션들 각각과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득한 후, 상기 복수의 어플리케이션들 각각의 설명 자료(DS)뿐만 아니라 상기 복수의 어플리케이션들 각각에 대한 상기 연관 어플리케이션들의 설명 자료(DS)를 함께 분석하여 상기 복수의 어플리케이션들 각각을 대표하는 대표 키워드들(REP_KWs)을 결정한다.At this time, as will be described later, the representative keyword determination system 10 of the application acquires a list of associated applications having a high degree of association with each of the plurality of applications for each of the plurality of applications, The representative keywords (REP_KWs) representative of each of the plurality of applications are determined by analyzing not only the description data (DS) of each of the applications but also the description data (DS) of the associated applications for each of the plurality of applications .

따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 정확하게 결정할 수 있다.Therefore, the representative keyword determination system 10 of the application according to the embodiments of the present invention can accurately determine the representative keywords (REP_KWs) that effectively show the characteristics of the application.

도 2는 본 발명의 일 실시예에 따른 어플리케이션의 대표 키워드 결정 방법을 나타내는 순서도이다.2 is a flowchart illustrating a representative keyword determination method of an application according to an embodiment of the present invention.

도 2에 도시된 어플리케이션의 대표 키워드 결정 방법은 도 1의 어플리케이션의 대표 키워드 결정 시스템(10)을 통해 수행될 수 있다.The representative keyword determination method of the application shown in FIG. 2 can be performed through the representative keyword determination system 10 of the application of FIG.

이하, 도 1 및 2를 참조하여 어플리케이션의 대표 키워드 결정 시스템(10)을 통해 수행되는 어플리케이션의 대표 키워드 결정 방법에 대해 상세히 설명한다.Hereinafter, a representative keyword determination method of an application performed through the representative keyword determination system 10 of the application will be described in detail with reference to FIGS. 1 and 2. FIG.

설명 자료 수집부(100)는 유무선 통신을 통해 어플리케이션 마켓(20)으로부터 복수의 어플리케이션들 각각의 설명 자료(DS)를 크롤링할 수 있다(단계 S100).The explanation data collecting unit 100 can crawl description data DS of each of a plurality of applications from the application market 20 through wired / wireless communication (step S100).

예를 들어, 설명 자료 수집부(100)는 어플리케이션 마켓(20)에 등록된 모든 어플리케이션들의 설명 자료(DS)를 순차적으로 검색하여 다운로드할 수 있다.For example, the description data collection unit 100 may sequentially search for and download explanatory data (DS) of all applications registered in the application market 20.

설명 자료 수집부(100)는 크롤링된 상기 복수의 어플리케이션들 각각의 설명 자료(DS)를 키워드 추출부(200)에 제공할 수 있다.The description data collection unit 100 may provide the description data DS of each of the plurality of crawled applications to the keyword extraction unit 200. [

키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 설명 자료(DS)에 포함되는 키워드들(KW) 및 설명 자료(DS)에서 키워드들(KW)의 비중들(GV)을 결정하여 제1 데이터베이스(300)에 저장할 수 있다(단계 S200).The keyword extracting unit 200 determines the specific gravity GV of the keywords KW from the keywords KW and the description data DS included in the description data DS for each of the plurality of applications May be stored in the first database 300 (step S200).

도 3은 도 2의 복수의 어플리케이션들 각각에 대하여, 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 제1 데이터베이스에 저장하는 단계(S200)의 일 예를 나타내는 순서도이다.FIG. 3 is a flowchart illustrating an example of a step S200 of determining the weight of the keywords in the description data and the keywords in the description data for each of the plurality of applications shown in FIG. 2, and storing the determined weight in the first database .

키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여 도 3에 도시된 동작들을 수행함으로써, 상기 복수의 어플리케이션들 각각의 키워드들(KW) 및 상응하는 어플리케이션의 설명 자료(DS)에서 키워드들(KW) 각각이 차지하는 비중들(GV)을 결정하여 제1 데이터베이스(300)에 저장할 수 있다.The keyword extracting unit 200 extracts keywords (KW) from the keywords (KW) of each of the plurality of applications and descriptive data (DS) of the corresponding application by performing the operations shown in FIG. 3 for each of the plurality of applications (GW) occupied by each of the first and second servers (KW) may be determined and stored in the first database (300).

구체적으로, 도 3을 참조하면, 키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 설명 자료(DS)에 대해 형태소 분석(morphological analysis)을 수행하여 설명 자료(DS)에 포함되는 키워드들(KW)을 추출할 수 있다(단계 S210).3, the keyword extracting unit 200 performs a morphological analysis on the description data DS for each of the plurality of applications to extract a keyword included in the description data DS (KW) (step S210).

일 실시예에 있어서, 키워드 추출부(200)는 설명 자료(DS)에 대해 형태소 분석을 수행하여 설명 자료(DS)에 포함되는 모든 형태소들을 추출한 후, 상기 파악된 형태소들 중에서 명사인 형태소들을 설명 자료(DS)의 키워드들(KW)로 결정할 수 있다.In one embodiment, the keyword extractor 200 extracts all the morphemes included in the description data DS by performing a morphological analysis on the description data DS, and then describes the morphemes that are nouns among the identified morphemes (KW) of the data (DS).

그러나 본 발명은 이에 한정되지 않으며, 실시예들에 따라서 키워드 추출부(200)는 다양한 종류의 형태소 분석 알고리즘을 사용하여 설명 자료(DS)에 포함되는 키워드들(KW)을 추출할 수 있다.However, the present invention is not limited thereto, and the keyword extracting unit 200 may extract keywords KW included in the description data DS using various types of morphological analysis algorithms.

이후, 키워드 추출부(200)는 키워드들(KW)이 추출된 설명 자료(DS)에서 키워드들(KW) 각각의 반복 횟수를 결정할 수 있다(단계 S220).Thereafter, the keyword extracting unit 200 may determine the number of repetitions of each of the keywords KW in the description data DS from which the keywords KW are extracted (step S220).

예를 들어, 키워드 추출부(200)는 키워드들(KW) 각각이 설명 자료(DS)에 포함되는 개수를 카운트하여 키워드들(KW) 각각의 상기 반복 횟수로 결정할 수 있다.For example, the keyword extracting unit 200 may count the number of the keywords KW included in the description data DS and determine the number of repetitions of each of the keywords KW.

이후, 키워드 추출부(200)는 키워드들(KW) 각각의 상기 반복 횟수를 키워드들(KW)의 상기 반복 횟수들의 총합으로 나눈 값을 키워드들(KW) 각각의 비중(GV)으로 결정할 수 있다(단계 S230).The keyword extracting unit 200 may then determine a value obtained by dividing the repetition count of each of the keywords KW by the total number of the repetitions of the keywords KW as the specific gravity GV of each of the keywords KW (Step S230).

예를 들어, 설명 자료(DS)에서 제1 키워드가 5회 반복되고, 제2 키워드가 3회 반복되고, 제3 키워드가 2회 반복되는 경우, 키워드 추출부(200)는 상기 제1 키워드의 비중(GV)은 0.5로 결정하고, 상기 제2 키워드의 비중(GV)은 0.3으로 결정하고, 상기 제3 키워드의 비중(GV)은 0.2로 결정할 수 있다.For example, when the first keyword is repeated five times, the second keyword is repeated three times, and the third keyword is repeated twice in the explanation data DS, the keyword extracting unit 200 extracts the first keyword The specific gravity GV may be determined to be 0.5, the specific gravity GV of the second keyword may be determined to be 0.3, and the specific gravity GV of the third keyword may be determined to be 0.2.

이후, 키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 키워드들(KW) 및 키워드들(KW)의 비중들(GV)을 상응하는 어플리케이션의 명칭(APP_N)과 연관시켜 제1 데이터베이스(300)에 저장할 수 있다(단계 S240).The keyword extracting unit 200 associates the keywords GWs of the keywords KW and KW with the corresponding application name APP_N for each of the plurality of applications, (Step S240).

도 4는 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제1 데이터베이스의 일 예를 나타내는 도면이다.4 is a diagram showing an example of a first database included in the representative keyword determination system of the application of FIG.

도 4를 참조하면, 제1 데이터베이스(300a)는 어플리케이션 필드(APP_F), 키워드 필드(KW_F), 및 비중 필드(GV_F)를 포함할 수 있다.Referring to FIG. 4, the first database 300a may include an application field APP_F, a keyword field KW_F, and a weight field GV_F.

키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 어플리케이션의 명칭(APP_N)을 어플리케이션 필드(APP_F)에 저장하고, 상응하는 어플리케이션의 키워드들(KW)을 키워드 필드(KW_F)에 저장하고, 상응하는 어플리케이션의 키워드들(KW)의 비중들(GV)을 비중 필드(GV_F)에 저장할 수 있다.The keyword extracting unit 200 stores the application name APP_N in the application field APP_F and stores the corresponding application keywords KW in the keyword field KW_F for each of the plurality of applications , And stores the specific gravity GVs of the corresponding application keywords KW in the gravity field GV_F.

도 4에는 예시적으로 APP1에 상응하는 어플리케이션의 키워드들(KW)은 "대화", "친구", 및 "첨부"로 결정되고, APP1에 상응하는 어플리케이션에서 "대화", "친구", 및 "첨부"의 비중(GV)은 각각 "0.40", "0.35", 및 "0.25"로 결정되고, APP2에 상응하는 어플리케이션의 키워드들(KW)은 "임신", "태교", "다이어리", 및 "영양"으로 결정되고, APP2에 상응하는 어플리케이션에서 "임신", "태교", "다이어리", 및 "영양"의 비중(GV)은 각각 "0.45", "0.30", "0.15", 및 "0.10"으로 결정된 것을 나타낸다.4, the keywords KW of the application corresponding to APP1 are determined to be "conversation", "friend", and "attachment", and "conversation", "friend", and " Appendix "are determined to be" 0.40 ", "0.35 ", and" 0.25 ", and the keywords KW of the application corresponding to APP2 are determined as "pregnancy ","Quot;, " pregnancy ", "diary ", and" nutrition "in the application corresponding to APP2 are determined as" 0.10 ".

다시 도 1 및 2를 참조하면, 연관 어플리케이션 결정부(400)는 상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택할 수 있다(단계 S300).1 and 2, the associated application determination unit 400 can select a target application among the plurality of applications (step S300).

예를 들어, 도 1에 도시된 바와 같이, 연관 어플리케이션 결정부(400)는 제1 데이터베이스(300)에 저장된 어플리케이션의 명칭들(APP_N) 중의 하나를 선택하여 상기 목표 어플리케이션의 명칭(T_APP_N)으로서 독출할 수 있다.For example, as shown in FIG. 1, the associated application determination unit 400 selects one of application name (APP_N) stored in the first database 300 as a target application name (T_APP_N) Can be released.

이후, 연관 어플리케이션 결정부(400)는 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 획득할 수 있다(단계 S400).Thereafter, the associated application determination unit 400 may obtain a list (CORR_APPs) of related applications having a high degree of association with the target application among the plurality of applications (step S400).

일 실시예에 있어서, 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 복수의 어플리케이션들 각각에 대한 연관 어플리케이션들의 목록들을 미리 저장할 수 있다.In one embodiment, the representative keyword determination system 10 of an application may previously store lists of associated applications for each of the plurality of applications.

이 경우, 연관 어플리케이션 결정부(400)는 어플리케이션의 대표 키워드 결정 시스템(10)에 미리 저장되는 상기 복수의 어플리케이션들 각각에 대한 연관 어플리케이션들의 목록들로부터 상기 목표 어플리케이션에 상응하는 연관 어플리케이션들의 목록(CORR_APPs)을 독출함으로써 상기 목표 어플리케이션에 대한 연관 어플리케이션들의 목록(CORR_APPs)을 획득할 수 있다(단계 S400).In this case, the associated application determination unit 400 extracts, from lists of related applications for each of the plurality of applications stored in advance in the representative keyword determination system 10 of the application, a list of related applications corresponding to the target application (CORR_APPs (CORR_APPs) of the associated applications for the target application (step S400).

도 5는 도 1에 도시된 어플리케이션의 대표 키워드 결정 시스템의 일 예를 나타내는 도면이다.5 is a diagram showing an example of a representative keyword determination system of the application shown in FIG.

도 5를 참조하면, 도 5에 도시된 어플리케이션의 대표 키워드 결정 시스템(10)은 도 1에 도시된 어플리케이션의 대표 키워드 결정 시스템(10)에서 제2 데이터베이스(DB2)(600)를 더 포함할 수 있다.5, the representative keyword determination system 10 of the application shown in FIG. 5 may further include a second database (DB2) 600 in the representative keyword determination system 10 of the application shown in FIG. 1 have.

제2 데이터베이스(600)는 상기 복수의 어플리케이션들 각각에 대한 연관 어플리케이션들의 목록들을 미리 저장할 수 있다.The second database 600 may store the list of related applications for each of the plurality of applications in advance.

이 경우, 연관 어플리케이션 결정부(400)는 제2 데이터베이스(600)로부터 상기 목표 어플리케이션에 상응하는 연관 어플리케이션들의 목록(CORR_APPs)을 독출할 수 있다.In this case, the associated application determination unit 400 may read a list (CORR_APPs) of associated applications corresponding to the target application from the second database 600. [

도 6은 도 5의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제2 데이터베이스의 일 예를 나타내는 도면이다.6 is a diagram showing an example of a second database included in the representative keyword determination system of the application of FIG.

도 6을 참조하면, 제2 데이터베이스(600)는 어플리케이션 필드(APP_F), 연관 어플리케이션 필드(CORR_APP_F), 및 연관 지수 필드(RI_F)를 포함할 수 있다.Referring to FIG. 6, the second database 600 may include an application field APP_F, an association application field CORR_APP_F, and an association index field RI_F.

어플리케이션 필드(APP_F)는 상기 복수의 어플리케이션들 각각의 명칭(APP_N)을 저장하고, 연관 어플리케이션 필드(CORR_APP_F)는 상응하는 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 저장하고, 연관 지수 필드(RI_F)는 상응하는 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들을 저장할 수 있다.The application field (APP_F) stores the name (APP_N) of each of the plurality of applications, the associated application field (CORR_APP_F) stores a list of associated applications having a high degree of association with the corresponding application, ) May store association indices indicating the degree of association between the corresponding application and the associated applications.

일 실시예에 있어서, 상기 연관 지수는 상기 상응하는 어플리케이션과 상기 연관 어플리케이션 사이의 연관도가 높을수록 상대적으로 큰 값을 갖고, 상기 상응하는 어플리케이션과 상기 연관 어플리케이션 사이의 연관도가 낮을수록 상대적으로 작은 값을 가질 수 있다.In one embodiment, the association index has a relatively large value as the degree of association between the corresponding application and the associated application is high, and the association index has a relatively small value as the association degree between the corresponding application and the associated application is low Value. ≪ / RTI >

도 6에는 예시적으로 APP1에 상응하는 어플리케이션의 연관 어플리케이션들은 APP3, APP4, 및 APP7이고, APP1과 APP3, APP4, 및 APP7 사이의 상기 연관 지수는 각각 A1, A2, 및 A3이고, APP2에 상응하는 어플리케이션의 연관 어플리케이션들은 APP4, APP5, APP8, 및 APP9이고, APP2와 APP4, APP5, APP8, 및 APP9 사이의 상기 연관 지수는 각각 A4, A5, A6, 및 A7인 것을 나타낸다. 여기서, A1, A2, A3, A4, A5, A6, 및 A7은 실수를 나타낸다.6 illustratively shows that the associated applications of the application corresponding to APP1 are APP3, APP4 and APP7, and the association indices between APP1 and APP3, APP4 and APP7 are A1, A2, and A3, respectively, The associated applications of the application are APP4, APP5, APP8, and APP9, and the association indices between APP2 and APP4, APP5, APP8, and APP9 are A4, A5, A6, and A7, respectively. Here, A1, A2, A3, A4, A5, A6, and A7 represent real numbers.

이 경우, 연관 어플리케이션 결정부(400)는 제2 데이터베이스(600)로부터 상기 목표 어플리케이션에 상응하는 연관 어플리케이션들의 목록(CORR_APPs) 및 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들(RIs)을 독출할 수 있다.In this case, the associated application determination unit 400 receives, from the second database 600, a list (CORR_APPs) of associated applications corresponding to the target application and association indexes RIs) can be read.

다른 실시예에 있어서, 연관 어플리케이션 결정부(400)는 다양한 사용자들이 사용하는 복수의 모바일 단말기들에 설치된 어플리케이션들의 설치 패턴을 분석하여 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 결정할 수 있다(단계 S400).In another embodiment, the associated application determination unit 400 analyzes installation patterns of applications installed in a plurality of mobile terminals used by various users, and determines a list (CORR_APPs) of related applications having a high degree of association with the target application (Step S400).

도 7은 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 연관 어플리케이션 결정부의 일 예를 나타내는 블록도이다.7 is a block diagram showing an example of an associated application determination unit included in the representative keyword determination system of the application shown in FIG.

도 7을 참조하면, 연관 어플리케이션 결정부(400)는 데이터 수신부(410), 제3 데이터베이스(DB3)(420), 비율 계산부(430), 연관도 분석부(440), 및 연관 어플리케이션 선택부(450)를 포함할 수 있다.7, the associated application determination unit 400 includes a data receiving unit 410, a third database (DB3) 420, a ratio calculation unit 430, an association analysis unit 440, (450).

도 8은 도 2의 복수의 어플리케이션들 중에서 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 단계(S400)의 일 예를 나타내는 순서도이다.FIG. 8 is a flowchart illustrating an example of acquiring a list of associated applications having a high degree of association with a target application (S400) among the plurality of applications of FIG.

도 8에 도시된 복수의 어플리케이션들 중에서 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 단계(S400)는 도 7에 도시된 연관 어플리케이션 결정부(400)를 통해 수행될 수 있다.The step S400 of acquiring a list of related applications having a high degree of association with the target application among the plurality of applications shown in FIG. 8 may be performed through the associated application determination unit 400 shown in FIG.

이하, 도 7 및 8을 참조하여 연관 어플리케이션 결정부(400)가 다양한 사용자들이 사용하는 복수의 모바일 단말기들(30)에 설치된 어플리케이션들의 설치 패턴을 분석하여 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 결정하는 방법의 일 예에 대해 상세히 설명한다.7 and 8, the associated application determination unit 400 analyzes an installation pattern of applications installed in a plurality of mobile terminals 30 used by various users and determines an associated application having a high degree of association with the target application Lt; RTI ID = 0.0 > (CORR_APPs). ≪ / RTI >

복수의 모바일 단말기들(30) 각각은 고유한 식별 아이디를 내부적으로 저장할 수 있다.Each of the plurality of mobile terminals 30 may internally store a unique identification ID.

일 실시예에 있어서, 상기 식별 아이디는 광고에 활용하기 위한 목적으로 모바일 단말기들마다 고유하게 부여된 광고 아이디(Advertising ID, ADID)일 수 있다.In one embodiment, the identification ID may be an advertisement ID (ADID) uniquely assigned to each mobile terminal for the purpose of utilizing the advertisement.

복수의 모바일 단말기들(30) 각각은 다양한 종류의 어플리케이션들을 어플리케이션 마켓(20)으로부터 다운로드하여 설치하고, 상기 설치된 어플리케이션들을 실행할 수 있다.Each of the plurality of mobile terminals 30 can download various types of applications from the application market 20, install them, and execute the installed applications.

복수의 모바일 단말기들(30) 각각은 복수의 모바일 단말기들(30) 각각의 상기 식별 아이디 및 복수의 모바일 단말기들(30) 각각에 설치된 모든 어플리케이션들의 목록을 포함하는 설치 로그 데이터(I_LOG)를 연관 어플리케이션 결정부(400)로 전송할 수 있다.Each of the plurality of mobile terminals 30 associates the installation log data I_LOG including the identification ID of each of the plurality of mobile terminals 30 and a list of all applications installed in each of the plurality of mobile terminals 30 To the application decision unit 400. [

일 실시예에 있어서, 복수의 모바일 단말기들(30) 각각에 설치된 어플리케이션들 중의 적어도 하나는 설치 로그 데이터 전송 모듈을 포함할 수 있다.In one embodiment, at least one of the applications installed in each of the plurality of mobile terminals 30 may include an install log data transfer module.

예를 들어, 어플리케이션 마켓(20)에 등록된 상기 복수의 어플리케이션들 중에서 미리 약정된 어플리케이션들은 상기 설치 로그 데이터 전송 모듈을 미리 포함할 수 있다.For example, applications that are prearranged among the plurality of applications registered in the application market 20 may include the installation log data transmission module in advance.

모바일 단말기(30)가 어플리케이션 마켓(20)으로부터 상기 미리 약정된 어플리케이션을 다운로드하여 설치하는 경우, 상기 설치 로그 데이터 전송 모듈도 모바일 단말기(30)에 함께 설치될 수 있다.When the mobile terminal 30 downloads and installs the prearranged application from the application market 20, the installation log data transfer module may be installed together with the mobile terminal 30. [

이후, 모바일 단말기(30)에서 상기 약정된 어플리케이션이 실행될 때마다, 상기 설치 로그 데이터 전송 모듈이 모바일 단말기(30)에서 자동으로 실행되어 모바일 단말기(30)의 상기 식별 아이디 및 모바일 단말기(30)에 설치된 어플리케이션들의 목록을 포함하는 설치 로그 데이터(I_LOG)를 연관 어플리케이션 결정부(400)로 전송할 수 있다.The install log data transfer module is automatically executed in the mobile terminal 30 every time when the committed application is executed in the mobile terminal 30 and the identification log of the mobile terminal 30 is transmitted to the mobile terminal 30 And may transmit the installation log data I_LOG including the list of the installed applications to the associated application determination unit 400.

도 9는 도 7에 도시된 복수의 모바일 단말기들 각각으로부터 연관 어플리케이션 결정부로 전송되는 설치 로그 데이터의 일 예를 나타내는 도면이다.9 is a diagram illustrating an example of installation log data transmitted from each of a plurality of mobile terminals shown in FIG. 7 to an associated application determination unit.

도 9를 참조하면, 설치 로그 데이터(I_LOG)는 모바일 단말기(30)의 식별 아이디(ADID) 및 모바일 단말기(30)에 설치된 어플리케이션들의 목록(APP_LIST)을 포함하는 반정형 데이터(semi-structured data)일 수 있다.9, the installation log data I_LOG includes semi-structured data including an identification ID (ADID) of the mobile terminal 30 and a list (APP_LIST) of applications installed in the mobile terminal 30, Lt; / RTI >

실시예에 따라서, 설치 로그 데이터(I_LOG)는 전송 날짜, 모바일 단말기(30)의 IP(Internet Protocol) 주소, 및 모바일 단말기(30)의 모델명을 더 포함할 수 있다.According to the embodiment, the installation log data I_LOG may further include a transmission date, an Internet Protocol (IP) address of the mobile terminal 30, and a model name of the mobile terminal 30. [

한편, 도 7에서 복수의 모바일 단말기들(30) 각각은 스마트폰(smart phone)인 것으로 도시되어 있으나, 본 발명은 이에 한정되지 않는다. 실시예에 따라서 복수의 모바일 단말기들(30) 각각은 태블릿 컴퓨터(tablet computer), 휴대폰(mobile phone), 개인 정보 단말기(personal digital assistant; PDA), 등과 같은 휴대 가능한 임의의 모바일 단말기일 수 있다.In FIG. 7, each of the plurality of mobile terminals 30 is shown as a smart phone, but the present invention is not limited thereto. Each of the plurality of mobile terminals 30 may be any portable mobile terminal such as a tablet computer, a mobile phone, a personal digital assistant (PDA), and the like.

다시 도 7 및 8을 참조하면, 연관 어플리케이션 결정부(400)에 포함되는 데이터 수신부(410)는 복수의 모바일 단말기들(30)로부터 복수의 모바일 단말기들(30) 각각의 식별 아이디(ADID) 및 복수의 모바일 단말기들(30) 각각에 설치된 어플리케이션들의 목록(APP_LIST)을 포함하는 설치 로그 데이터(I_LOG)를 수신하여 제3 데이터베이스(420)에 저장할 수 있다(단계 S410).7 and 8, the data receiving unit 410 included in the associated application determination unit 400 receives the identification ID (ADID) of each of the plurality of mobile terminals 30 from the plurality of mobile terminals 30, The installation log data I_LOG including a list of applications (APP_LIST) installed in each of the plurality of mobile terminals 30 may be received and stored in the third database 420 (step S410).

도 10은 도 7의 연관 어플리케이션 결정부에 포함되는 제3 데이터베이스의 일 예를 나타내는 도면이다.10 is a diagram showing an example of a third database included in the associated application determination unit of FIG.

도 10을 참조하면, 제3 데이터베이스(420)는 식별 아이디 필드(ADID_F) 및 어플리케이션 목록 필드(APP_LIST_F)를 포함할 수 있다.Referring to FIG. 10, the third database 420 may include an identification ID field (ADID_F) and an application list field (APP_LIST_F).

데이터 수신부(410)가 복수의 모바일 단말기들(30) 각각으로부터 설치 로그 데이터(I_LOG)를 수신하는 경우, 설치 로그 데이터(I_LOG)에 포함되는 식별 아이디(ADID)는 제3 데이터베이스(420)의 식별 아이디 필드(ADID_F)에 저장하고, 설치 로그 데이터(I_LOG)에 포함되는 어플리케이션들의 목록(APP_LIST)은 제3 데이터베이스(420)의 어플리케이션 목록 필드(APP_LIST_F)에 저장할 수 있다.When the data receiving unit 410 receives the installation log data I_LOG from each of the plurality of mobile terminals 30, the identification ID ADID included in the installation log data I_LOG is the identification of the third database 420 And the list APP_LIST of the applications included in the installation log data I_LOG may be stored in the application list field APP_LIST_F of the third database 420. [

도 10에는 예시적으로 식별 아이디(ADID)가 ADID1에 상응하는 모바일 단말기(30)에는 APP1, APP3, APP5 등의 어플리케이션들이 설치되어 있고, 식별 아이디(ADID)가 ADID2에 상응하는 모바일 단말기(30)에는 APP2, APP3, APP6 등의 어플리케이션들이 설치되어 있는 것을 나타낸다.10 shows an example in which applications such as APP1, APP3 and APP5 are installed in the mobile terminal 30 in which the identification ID ADID corresponds to ADID1 and the identification ID ADID is stored in the mobile terminal 30 corresponding to the ADID2. Indicates that applications such as APP2, APP3, and APP6 are installed.

다시 도 7 및 8을 참조하면, 연관 어플리케이션 결정부(400)에 포함되는 비율 계산부(430)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택할 수 있다(단계 S300).7 and 8, the ratio calculation unit 430 included in the associated application determination unit 400 can select a target application among the plurality of applications stored in the first database 300 (step S300) .

예를 들어, 도 1에 도시된 바와 같이, 비율 계산부(430)는 제1 데이터베이스(300)에 저장된 어플리케이션의 명칭들(APP_N) 중의 하나를 선택하여 상기 목표 어플리케이션의 명칭(T_APP_N)으로서 독출할 수 있다.For example, as shown in FIG. 1, the ratio calculation unit 430 selects one of application name (APP_N) stored in the first database 300 and reads it as the target application name (T_APP_N) .

또한, 비율 계산부(430)는 상기 목표 어플리케이션과의 연관도를 분석할 제1 내지 제k 어플리케이션들을 결정할 수 있다. 여기서, k는 양의 정수를 나타낸다.Also, the ratio calculation unit 430 may determine the first to k-th applications to analyze the degree of association with the target application. Here, k represents a positive integer.

일 실시예에 있어서, 비율 계산부(430)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션을 제외한 나머지 어플리케이션들을 상기 제1 내지 제k 어플리케이션들로 결정할 수 있다.In one embodiment, the ratio calculation unit 430 may determine the first to k-th applications other than the target application among the plurality of applications stored in the first database 300. [

다른 실시예에 있어서, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 모든 어플리케이션들 중에서 상기 목표 어플리케이션을 제외한 나머지 어플리케이션들을 상기 제1 내지 제k 어플리케이션들로 결정할 수 있다.In another embodiment, the ratio calculation unit 430 may determine the first to k-th applications other than the target application among all the applications stored in the third database 420.

이후, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 복수의 모바일 단말기들(30) 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들(30)의 비율에 상응하는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k)을 결정할 수 있다(단계 S420).The ratio calculator 430 then calculates the ratio of the first to k-th (k-1) th mobile terminals 30 among the plurality of mobile terminals 30 based on the installation log data I_LOG of the plurality of mobile terminals 30 stored in the third database 420 It is possible to determine the first to kth overall ratios T_RATE_1 to T_RATE_k corresponding to the proportion of the mobile terminals 30 in which each of the applications is installed (step S420).

도 11은 도 8의 복수의 모바일 단말기들 중에서 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 전체 비율들을 결정하는 단계(S420)의 일 예를 나타내는 순서도이다.11 is a flowchart showing an example of a step S420 of determining the first to k-th overall ratios corresponding to the ratios of the mobile terminals in which the first to k-th applications are installed among the plurality of mobile terminals in Fig. 8 .

도 11을 참조하면, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 복수의 모바일 단말기들(30)에 상응하는 식별 아이디들(ADID)의 개수를 전체 개수로 결정할 수 있다(단계 S421).11, the ratio calculation unit 430 calculates the ratio of the mobile terminal 30 corresponding to the plurality of mobile terminals 30 based on the installation log data I_LOG of the plurality of mobile terminals 30 stored in the third database 420 The total number of identification IDs (ADID) can be determined (step S421).

상술한 바와 같이, 식별 아이디(ADID)는 모바일 단말기들마다 고유하게 부여된 식별값이므로, 상기 전체 개수는 복수의 모바일 단말기들(30)의 총 개수에 상응할 수 있다.As described above, since the identification ID (ADID) is an identification value uniquely assigned to mobile terminals, the total number may correspond to the total number of the plurality of mobile terminals 30.

또한, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)에 상응하는 식별 아이디들(ADID)의 개수를 제j 설치 개수로 결정할 수 있다(단계 S423). 여기서, j는 1 이상 k 이하의 임의의 양의 정수를 나타낸다.The ratio calculation unit 430 calculates the ratio of the mobile terminal 30 to the mobile terminal 30 based on the installation log data I_LOG of the plurality of mobile terminals 30 stored in the third database 420 The number of identification IDs (ADID) can be determined as the j-th installation number (step S423). Here, j represents any positive integer equal to or greater than 1 and equal to or less than k.

따라서 상기 제j 설치 개수는 복수의 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 개수에 상응할 수 있다.Therefore, the number of the j-th installation may correspond to the number of the mobile terminals 30 in which the j-th application is installed among the plurality of mobile terminals 30. [

이후, 비율 계산부(430)는 상기 제j 설치 개수를 상기 전체 개수로 나눈 값을 제j 전체 비율(T_RATE_j)로 결정할 수 있다(단계 S425).Then, the ratio calculation unit 430 may determine a j-th overall ratio (T_RATE_j) by dividing the number of the j-th installation by the total number (step S425).

따라서 제j 전체 비율(T_RATE_j)은 복수의 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율을 나타낼 수 있다.Therefore, the j-th overall ratio T_RATE_j may represent the proportion of the mobile terminals 30 in which the j-th application is installed among the plurality of mobile terminals 30.

비율 계산부(430)는 상기 제1 내지 제k 어플리케이션들 각각에 대해 상술한 단계들(S423 및 S425)을 반복적으로 수행함으로써 복수의 모바일 단말기들(30) 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들(30)의 비율에 상응하는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k)을 결정할 수 있다.The ratio calculation unit 430 repeatedly performs the above-described steps S423 and S425 for each of the first to k-th applications, thereby calculating the ratio of the first to k-th applications among the plurality of mobile terminals 30 The first to kth total ratios T_RATE_1 to T_RATE_k corresponding to the ratio of the mobile terminals 30 installed can be determined.

다시 도 7 및 8을 참조하면, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들(30)의 비율에 상응하는 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)을 결정할 수 있다(단계 S430).Referring to FIGS. 7 and 8 again, the ratio calculation unit 430 calculates the ratio of the mobile terminal 30 installed with the target application based on the installation log data I_LOG of the plurality of mobile terminals 30 stored in the third database 420 (I_RATE_1 to I_RATE_k) corresponding to the ratio of the mobile terminals 30 installed with the first to k-th applications among the first to k-th applications 30 (step S430).

도 12는 도 8의 목표 어플리케이션이 설치된 모바일 단말기들 중에서 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 교차 비율들을 결정하는 단계(S430)의 일 예를 나타내는 순서도이다.12 shows an example of a step (S430) of determining first to kth intersection ratios corresponding to ratios of mobile terminals in which each of the first to k-th applications among the mobile terminals in which the target application of Fig. 8 is installed It is a flowchart.

도 12를 참조하면, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들(30)에 상응하는 식별 아이디들(ADID)의 개수를 목표 설치 개수로 결정할 수 있다(단계 S431).12, the ratio calculation unit 430 calculates the ratio of the mobile terminals 30 installed with the target application based on the installation log data I_LOG of the plurality of mobile terminals 30 stored in the third database 420, The number of identification IDs (ADID) corresponding to the target ID number (step S431).

따라서 상기 목표 설치 개수는 복수의 모바일 단말기들(30) 중에서 상기 목표 어플리케이션이 설치된 모바일 단말기들(30)의 개수에 상응할 수 있다.Therefore, the target installation number may correspond to the number of the mobile terminals 30 in which the target application is installed among the plurality of mobile terminals 30.

또한, 비율 계산부(430)는 제3 데이터베이스(420)에 저장된 복수의 모바일 단말기들(30)의 설치 로그 데이터(I_LOG)에 기초하여 상기 목표 어플리케이션과 상기 제j 어플리케이션이 함께 설치된 모바일 단말기들(30)에 상응하는 식별 아이디들(ADID)의 개수를 제j 교차 개수로 결정할 수 있다(단계 S433).The ratio calculation unit 430 may calculate the ratio of the mobile terminal 30 installed in the third database 420 based on the installation log data I_LOG of the plurality of mobile terminals 30 The number of identification IDs (ADID) corresponding to the number of identification IDs (ADID) 30 (step S433).

따라서 상기 제j 교차 개수는 복수의 모바일 단말기들(30) 중에서 상기 목표 어플리케이션과 상기 제j 어플리케이션이 함께 설치된 모바일 단말기들(30)의 개수에 상응할 수 있다.Therefore, the number of the j-th intersection may correspond to the number of the mobile terminals 30 installed together with the target application and the j-th application among the plurality of mobile terminals 30. [

이후, 비율 계산부(430)는 상기 제j 교차 개수를 상기 목표 설치 개수로 나눈 값을 제j 교차 비율(I_RATE_j)로 결정할 수 있다(단계 S435).Then, the ratio calculation unit 430 may determine the j-th intersection ratio I_RATE_j as a value obtained by dividing the j-th intersection number by the target installation number (step S435).

따라서 제j 교차 비율(I_RATE_j)은 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율을 나타낼 수 있다.Therefore, the j-th intersection ratio I_RATE_j may indicate the ratio of the mobile terminals 30 in which the j-th application is installed among the mobile terminals 30 in which the target application is installed.

비율 계산부(430)는 상기 제1 내지 제k 어플리케이션들 각각에 대해 상술한 단계들(S433 및 S435)을 반복적으로 수행함으로써 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들(30)의 비율에 상응하는 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)을 결정할 수 있다.The ratio calculation unit 430 repeatedly performs the above-described steps S433 and S435 for each of the first to k-th applications to calculate the ratio of the first to k-th applications among the mobile terminals 30, The first to kth intersection ratios I_RATE_1 to I_RATE_k corresponding to the ratio of the mobile terminals 30 in which each of the applications is installed.

이후, 비율 계산부(430)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 및 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)을 연관도 분석부(440)에 제공할 수 있다.The ratio calculator 430 may provide the first to kth total ratios T_RATE_1 to T_RATE_k and the first to kth intersection ratios I_RATE_1 to I_RATE_k to the association analyzer 440.

다시 도 7 및 8을 참조하면, 연관 어플리케이션 결정부(400)에 포함되는 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 및 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다(단계 S440).7 and 8, the association analysis unit 440 included in the association application determination unit 400 determines whether the first to kth total ratios T_RATE_1 to T_RATE_k and the first to kth intersection ratios I_RATE_1 to I_RATE_k), the first to k-th association exponents RI_1 to RI_k indicating the degree of association between the target application and each of the first to k-th applications can be determined (step S440).

상술한 바와 같이, 제j 전체 비율(T_RATE_j)은 복수의 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율을 나타내고, 제j 교차 비율(I_RATE_j)은 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율을 나타내므로, 제j 교차 비율(I_RATE_j)이 제j 전체 비율(T_RATE_j)보다 큰 경우 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 연관성(correlation)이 존재하고, 제j 교차 비율(I_RATE_j)이 제j 전체 비율(T_RATE_j)보다 작은 경우 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 반연관성(inverse correlation)이 존재할 수 있다.As described above, the j-th overall ratio T_RATE_j indicates the proportion of the mobile terminals 30 in which the j-th application is installed among the plurality of mobile terminals 30, and the j-th intersection ratio I_RATE_j indicates the ratio (I_RATE_j) is greater than the j-th total rate (T_RATE_j), the target application and the target application are not included in the mobile terminal 30 when the j-th intersection ratio I_RATE_j is greater than the j- There may be an inverse correlation between the target application and the j-th application if there is a correlation between the j-th application and the j-th intersection ratio I_RATE_j is smaller than the total ratio T_RATE_j have.

여기서, 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 연관성(correlation)이 존재한다는 것은 상기 제j 어플리케이션의 평균적인 설치 비율에 비해 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 비율이 더 크다는 것을 의미하고, 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 반연관성(inverse correlation)이 존재한다는 것은 상기 제j 어플리케이션의 평균적인 설치 비율에 비해 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 비율이 더 작다는 것을 의미한다.Here, the presence of correlation between the target application and the j-th application means that a ratio of the installed rate of the j-th application among the mobile terminals 30 in which the target application is installed is smaller than an average installation ratio of the j-th application And the presence of an inverse correlation between the target application and the j-th application means that the average rate of installation of the j-th application is higher than the average installation rate of the j-th application, It means that the rate of installing the j-th application is smaller.

일 실시예에 있어서, 연관도 분석부(440)는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 연관성(correlation)이 존재하는 경우, 제j 연관 지수(RI_j)가 양의 값을 갖도록 제j 연관 지수(RI_j)를 결정하고, 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이에 반연관성(inverse correlation)이 존재하는 경우, 제j 연관 지수(RI_j)가 음의 값을 갖도록 제j 연관 지수(RI_j)를 결정할 수 있다.In one embodiment, when there is a correlation between the target application and the j-th application, the association analyzing unit 440 determines that the j-th association index RI_j has a positive value, (RI_j), and when the inverse correlation exists between the target application and the j-th application, the j-th relevance index (RI_j) is determined such that the j-th association index (RI_j) has a negative value .

구체적으로, 연관도 분석부(440)는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관성(correlation)이 높을수록 제j 연관 지수(RI_j)가 양의 값을 가지면서 상대적으로 큰 절대값을 갖도록 제j 연관 지수(RI_j)를 결정하고, 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 반연관성(inverse correlation)이 높을수록 제j 연관 지수(RI_j)가 음의 값을 가지면서 상대적으로 큰 절대값을 갖도록 제j 연관 지수(RI_j)를 결정할 수 있다.Specifically, the association analyzing unit 440 determines whether the j-th association index RI_j has a positive value and a relatively large absolute value as the correlation between the target application and the j-th application is high. j association index RI_j and determines that the j-th association index RI_j has a negative value and a relatively large absolute value as the inverse correlation between the target application and the j-th application increases. The j-th association index RI_j can be determined.

이하, 연관도 분석부(440)가 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 및 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k)에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 다양한 실시예들에 대해 설명한다.Hereinafter, the association analyzing unit 440 determines whether or not the target application and the first to k-th (k-1) th to k-th (k) based on the first to kth overall ratios T_RATE_1 to T_RATE_k and the first to kth intersection ratios I_RATE_1 to I_RATE_k. Various embodiments for determining the first to k < th > k association indices RI_1 to RI_k indicating the degree of association between each of the applications will be described.

일 실시예에 있어서, 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각과 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각 사이의 차이에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.In one embodiment, the association analyzing unit 440 calculates the correlation ratios (I_RATE_1 to I_RATE_k) based on the differences between the first to kth total ratios T_RATE_1 to T_RATE_k and the first to kth intersection ratios I_RATE_1 to I_RATE_k, 1 to k < th > association indexes RI_1 to RI_k.

예를 들어, 연관도 분석부(440)는 아래의 [수학식 1]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.For example, the association analyzer 440 may determine the first through k-th association exponents RI_1 through RI_k based on the following Equation (1).

[수학식 1][Equation 1]

Figure 112018042121407-pat00001
Figure 112018042121407-pat00001

여기서, j는 k 이하의 양의 정수를 나타내고, RI_j는 상기 제j 연관 지수를 나타내고, I_RATE_j는 상기 제j 교차 비율을 나타내고, T_RATE_j는 상기 제j 전체 비율을 나타낸다.J denotes a positive integer equal to or less than k, RI_j denotes the j-th association index, I_RATE_j denotes the j-th intersection ratio, and T_RATE_j denotes the j-th total ratio.

연관도 분석부(440)가 상기 [수학식 1]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 경우, 제j 연관 지수(RI_j)는 상기 목표 어플리케이션이 설치된 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율과 복수의 모바일 단말기들(30) 중에서 상기 제j 어플리케이션이 설치된 모바일 단말기들(30)의 비율의 차이를 그대로 나타내므로, 제j 연관 지수(RI_j)는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관성(correlation) 또는 반연관성(inverse correlation)을 객관적으로 나타낼 수 있다.When the association analyzing unit 440 determines the first through k-th associated indexes RI_1 through RI_k based on Equation (1), the j-th relevance index RI_j may be determined based on the j- (30) having the j-th application and the ratio of the mobile terminals (30) having the j-th application installed among the plurality of mobile terminals (30) The j-th association index RI_j may objectively indicate a correlation or an inverse correlation between the target application and the j-th application.

이와 같이, 본 발명의 실시예들에 따른 연관 어플리케이션 결정부(400)는 복수의 모바일 단말기들(30)의 사용자들의 상기 제1 내지 제k 어플리케이션들에 대한 주관적인 선호도 평가에 대한 고려 없이, 복수의 모바일 단말기들(30)에 설치된 어플리케이션들의 목록(APP_LIST)에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 추정하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.As described above, the associated application determination unit 400 according to the embodiments of the present invention can determine whether or not a plurality of mobile terminals 30 have a plurality of mobile terminals 30 without considering the subjective preference evaluation of the first to k- The first to kth association indices RI_1 to RI_k are estimated by estimating a degree of association between the target application and each of the first to k-th applications based on a list (APP_LIST) of applications installed in the mobile terminals 30, Can be determined.

따라서 연관 어플리케이션 결정부(400)는 어플리케이션들 사이의 연관도 분석의 객관성 및 정확성을 효과적으로 향상시킬 수 있다.Therefore, the associated application determination unit 400 can effectively improve the objectivity and accuracy of the association analysis between applications.

다른 실시예에 있어서, 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각에 대한 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각의 비율에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.In another embodiment, the association analyzing unit 440 may calculate the correlation ratios I_RATE_1 to I_RATE_k based on the ratios of the first to kth intersection ratios I_RATE_1 to I_RATE_k for the first to kth overall ratios T_RATE_1 to T_RATE_k, 1 to k < th > association indexes RI_1 to RI_k.

예를 들어, 연관도 분석부(440)는 아래의 [수학식 2]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.For example, the association analyzing unit 440 may determine the first to k-th association exponents RI_1 to RI_k based on the following Equation (2).

[수학식 2]&Quot; (2) "

Figure 112018042121407-pat00002
Figure 112018042121407-pat00002

여기서, j는 k 이하의 양의 정수를 나타내고, RI_j는 상기 제j 연관 지수를 나타내고, I_RATE_j는 상기 제j 교차 비율을 나타내고, T_RATE_j는 상기 제j 전체 비율을 나타낸다.J denotes a positive integer equal to or less than k, RI_j denotes the j-th association index, I_RATE_j denotes the j-th intersection ratio, and T_RATE_j denotes the j-th total ratio.

연관도 분석부(440)가 상기 [수학식 2]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 경우, 제j 연관 지수(RI_j)는 제j 전체 비율(T_RATE_j)과 제j 교차 비율(I_RATE_j) 사이의 비율에 기초하여 결정되므로, 제j 전체 비율(T_RATE_j)과 제j 교차 비율(I_RATE_j)의 크기가 서로 비슷한 경우에도 제j 연관 지수(RI_j)는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관성(correlation) 또는 반연관성(inverse correlation)을 효과적으로 나타낼 수 있다.The relevance analyzing unit 440 determines the first to k-th related indexes RI_1 to RI_k based on the above equation (2), the j-th relevance index RI_j is the j-th total ratio T_RATE_j, The j-th relevance index RI_j is determined based on the ratio between the first j-th intersection ratio I_RATE_j and the j-th intersection ratio I_RATE_j, even when the jth total ratio T_RATE_j and the j- Correlation and inverse correlation between the j-th application and the j-th application.

또한, 상기 목표 어플리케이션의 평균적인 설치 비율이 상대적으로 작은 경우, 제j 전체 비율(T_RATE_j)과 제j 교차 비율(I_RATE_j)의 크기는 모두 상대적으로 작은 값을 가질 수 있다. 이러한 경우에도, 연관도 분석부(440)가 상기 [수학식 2]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 경우, 제j 연관 지수(RI_j)는 제j 전체 비율(T_RATE_j)과 제j 교차 비율(I_RATE_j) 사이의 비율에 기초하여 결정되므로, 본 발명의 실시예들에 따른 연관 어플리케이션 결정부(400)는 어플리케이션들 사이의 연관도 분석의 정확성을 효과적으로 향상시킬 수 있다.Also, when the average installation rate of the target application is relatively small, the size of the jth total ratio (T_RATE_j) and the jth intersection ratio (I_RATE_j) may be relatively small. In this case also, when the association analyzing unit 440 determines the first to k-th related indexes RI_1 to RI_k based on the above-mentioned Equation (2), the j-th association index RI_j is a Is determined based on the ratio between the ratio T_RATE_j and the j-th intersection ratio I_RATE_j, the associated application determination unit 400 according to the embodiments of the present invention effectively improves the accuracy of the association analysis between applications .

또 다른 실시예에 있어서, 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각과 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각 사이의 차이 및 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각에 대한 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각의 비율에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.In another embodiment, the association analyzing unit 440 calculates the difference between each of the first to kth total ratios T_RATE_1 to T_RATE_k and the first to kth intersection ratios I_RATE_1 to I_RATE_k, The first to k-th associative exponents RI_1 to RI_k may be determined based on the ratio of each of the first to k-th intersection ratios I_RATE_1 to I_RATE_k to the kth total ratios T_RATE_1 to T_RATE_k, respectively .

예를 들어, 연관도 분석부(440)는 아래의 [수학식 3]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.For example, the association analyzer 440 may determine the first to k-th association exponents RI_1 to RI_k based on the following Equation (3).

[수학식 3]&Quot; (3) "

Figure 112018042121407-pat00003
Figure 112018042121407-pat00003

Figure 112018042121407-pat00004
Figure 112018042121407-pat00004

Figure 112018042121407-pat00005
Figure 112018042121407-pat00005

여기서, j는 k 이하의 양의 정수를 나타내고, RI_j는 상기 제j 연관 지수를 나타내고, I_RATE_j는 상기 제j 교차 비율을 나타내고, T_RATE_j는 상기 제j 전체 비율을 나타내고, ABS()는 절대값 연산을 나타내고, A_DIFF_j는 제j 절대 비율 차이를 나타내고, R_DIFF_j는 제j 상대 비율 차이를 나타낸다.J represents a positive integer equal to or less than k, RI_j represents the j-th association index, I_RATE_j represents the j-th intersection ratio, T_RATE_j represents the j-th total ratio, ABS A_DIFF_j represents a j-th absolute ratio difference, and R_DIFF_j represents a j-th relative ratio difference.

상기 [수학식 1], 상기 [수학식 2], 및 상기 [수학식 3]을 비교하면, 제j 절대 비율 차이(A_DIFF_j)는 상기 [수학식 1]에 따른 제j 연관 지수(RI_j)와 동일하고, 제j 상대 비율 차이(R_DIFF_j)는 상기 [수학식 2]에 따른 제j 연관 지수(RI_j)와 동일하다. 따라서, 제j 절대 비율 차이(A_DIFF_j) 및 제j 상대 비율 차이(R_DIFF_j)에 대한 중복되는 설명은 생략한다.When comparing the above-mentioned Equations (1), (2) and (3), the j-th absolute ratio difference A_DIFF_j can be calculated by using the j-th association index RI_j And the j-th relative ratio difference R_DIFF_j is equal to the j-th association index RI_j according to Equation (2). Therefore, redundant description of the j-th absolute rate difference A_DIFF_j and the j-th relative rate difference R_DIFF_j will be omitted.

상기 [수학식 3]을 참조하면, 제j 절대 비율 차이(A_DIFF_j), 제j 상대 비율 차이(R_DIFF_j), 및 제j 연관 지수(RI_j)는 서로 동일한 부호를 가지므로, 연관도 분석부(440)가 상기 [수학식 3]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정하는 경우, 제j 연관 지수(RI_j)는 제j 절대 비율 차이(A_DIFF_j)와 제j 상대 비율 차이(R_DIFF_j)의 기하 평균에 상응할 수 있다.Referring to Equation (3), since the j-th absolute rate difference A_DIFF_j, the j-th relative rate difference R_DIFF_j, and the j-th related index RI_j have the same sign, ) Determines the first to k-th related indexes RI_1 to RI_k based on the above-described Equation (3), the j-th association index RI_j is a sum of the j-th absolute rate difference A_DIFF_j and the j- May correspond to the geometric mean of the difference R_DIFF_j.

따라서 상기 [수학식 3]에 따른 제j 연관 지수(RI_j)는 제j 절대 비율 차이(A_DIFF_j)가 갖는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관도 분석의 장점과 제j 상대 비율 차이(R_DIFF_j)가 갖는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관도 분석의 장점을 모두 가질 수 있다.Therefore, the j-th relevance index RI_j according to Equation (3) is the sum of the advantages of the association analysis between the target application and the j-th application in the j-th absolute rate difference A_DIFF_j and the j- ) May have all of the advantages of analyzing the association between the target application and the j-th application.

따라서 본 발명의 실시예들에 따른 연관 어플리케이션 결정부(400)는 어플리케이션들 사이의 연관도 분석의 객관성 및 정확성을 더욱 효과적으로 향상시킬 수 있다.Therefore, the associated application determination unit 400 according to the embodiments of the present invention can more effectively improve the objectivity and accuracy of the association analysis between applications.

또 다른 실시예에 있어서, 연관도 분석부(440)는 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각과 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각 사이의 차이, 제1 내지 제k 전체 비율들(T_RATE_1~T_RATE_k) 각각에 대한 제1 내지 제k 교차 비율들(I_RATE_1~I_RATE_k) 각각의 비율, 및 0보다 크고 1보다 작은 값을 갖는 가중치에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.In another embodiment, the association analyzing unit 440 calculates a difference between each of the first to kth total ratios T_RATE_1 to T_RATE_k and each of the first to kth intersection ratios I_RATE_1 to I_RATE_k, Based on the ratio of each of the first through k-th intersection ratios I_RATE_1 through I_RATE_k for each of the k-th overall ratios T_RATE_1 through T_RATE_k, and the weights having a value larger than 0 and smaller than 1, The association indexes RI_1 to RI_k can be determined.

예를 들어, 연관도 분석부(440)는 아래의 [수학식 4]에 기초하여 제1 내지 제k 연관 지수들(RI_1~RI_k)을 결정할 수 있다.For example, the association analyzer 440 may determine the first through k-th association exponents RI_1 through RI_k based on Equation (4) below.

[수학식 4]&Quot; (4) "

Figure 112018042121407-pat00006
Figure 112018042121407-pat00006

Figure 112018042121407-pat00007
Figure 112018042121407-pat00007

Figure 112018042121407-pat00008
Figure 112018042121407-pat00008

여기서, j는 k 이하의 양의 정수를 나타내고, RI_j는 상기 제j 연관 지수를 나타내고, I_RATE_j는 상기 제j 교차 비율을 나타내고, T_RATE_j는 상기 제j 전체 비율을 나타내고, wt는 상기 가중치를 나타내고, ABS()는 절대값 연산을 나타내고, A_DIFF_j는 제j 절대 비율 차이를 나타내고, R_DIFF_j는 제j 상대 비율 차이를 나타낸다.J denotes a positive integer equal to or less than k, RI_j denotes the j-th association index, I_RATE_j denotes the j-th intersection ratio, T_RATE_j denotes the j-th overall ratio, wt denotes the weight, ABS () represents an absolute value operation, A_DIFF_j represents a j-th absolute ratio difference, and R_DIFF_j represents a j-th relative ratio difference.

일 실시예에 있어서, 연관도 분석부(440)는 외부로부터의 입력을 통해 가중치(wt)를 획득할 수 있다.In one embodiment, the association analyzer 440 may obtain a weight (wt) through an input from the outside.

다른 실시예에 있어서, 연관도 분석부(440)는 내부적으로 미리 저장된 가중치(wt)를 독출함으로써 가중치(wt)를 획득할 수 있다.In an alternative embodiment, the association analyzer 440 may internally obtain the weight (wt) by reading the previously stored weight (wt).

상기 [수학식 3]과 상기 [수학식 4]를 비교하면, 상기 [수학식 4]에 따른 제j 연관 지수(RI_j)는 가중치(wt)를 적용한 제j 절대 비율 차이(A_DIFF_j)와 제j 상대 비율 차이(R_DIFF_j)의 가중 기하 평균에 상응할 수 있다.The j-th relevance index RI_j according to Equation (4) can be calculated by substituting the j-th absolute ratio difference A_DIFF_j applying the weight wt and the j- May correspond to the weighted geometric mean of the relative ratio difference R_DIFF_j.

따라서 상기 [수학식 4]에 따른 제j 연관 지수(RI_j)는 제j 절대 비율 차이(A_DIFF_j)가 갖는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관도 분석의 장점과 제j 상대 비율 차이(R_DIFF_j)가 갖는 상기 목표 어플리케이션과 상기 제j 어플리케이션 사이의 연관도 분석의 장점을 모두 가질 수 있다.Therefore, the j-th relevance index RI_j according to Equation (4) can be calculated by taking advantage of the degree of association analysis between the target application and the j-th application possessed by the j-th absolute rate difference A_DIFF_j, ) May have all of the advantages of analyzing the association between the target application and the j-th application.

또한, 가중치(wt)의 값을 조절함으로써 제j 절대 비율 차이(A_DIFF_j)가 제j 연관 지수(RI_j)에 미치는 영향과 제j 상대 비율 차이(R_DIFF_j)가 제j 연관 지수(RI_j)에 미치는 영향은 조절될 수 있다.The influence of the j-th absolute ratio difference A_DIFF_j on the j-th relevance index RI_j and the influence of the j-th relative ratio difference R_DIFF_j on the j-th relevance index RI_j by adjusting the values of the weights wT Can be adjusted.

따라서 본 발명의 실시예들에 따른 연관 어플리케이션 결정부(400)는 상기 목표 어플리케이션의 특성에 따라 가중치(wt)의 값을 조절함으로써 어플리케이션들 사이의 연관도 분석의 정확성을 더욱 향상시킬 수 있다.Therefore, the associated application determination unit 400 according to the embodiments of the present invention can further improve the accuracy of the association analysis between applications by adjusting the value of the weight (wt) according to the characteristics of the target application.

다시 도 7 및 8을 참조하면, 연관 어플리케이션 결정부(400)에 포함되는 연관 어플리케이션 선택부(450)는 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들(RI_1~RI_k)의 크기를 비교하여, 상기 제1 내지 제k 어플리케이션들 중에서 상대적으로 높은 연관 지수를 갖는 어플리케이션들을 상기 목표 어플리케이션에 대한 상기 연관 어플리케이션들로 결정할 수 있다(단계 S450).Referring again to FIGS. 7 and 8, the associated application selection unit 450 included in the associated application determination unit 400 determines whether or not the target application and the first to k- k association indices RI_1 to RI_k to determine the applications having a relatively high association index among the first to k-th applications as the related applications for the target application (step S450) .

일 실시예에 있어서, 연관 어플리케이션 선택부(450)는 상기 제1 내지 제k 어플리케이션들 중에서 연관 지수가 높은 순서대로 미리 정해진 개수의 어플리케이션들을 상기 연관 어플리케이션들로 결정할 수 있다.In one embodiment, the associated application selecting unit 450 may determine a predetermined number of applications as the related applications in order of the association indexes among the first to k-th applications.

다른 실시예에 있어서, 연관 어플리케이션 선택부(450)는 상기 제1 내지 제k 어플리케이션들 중에서 문턱값보다 높은 연관 지수를 갖는 어플리케이션들을 상기 연관 어플리케이션들로 결정할 수 있다.In another embodiment, the associated application selecting unit 450 may determine, among the first to k-th applications, applications having an association index higher than a threshold value as the associated applications.

이후, 연관 어플리케이션 선택부(450)는 상기 목표 어플리케이션에 대한 연관 어플리케이션들의 목록(CORR_APPs) 및 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들(RIs)을 키워드 분석부(500)에 제공할 수 있다.Then, the associated application selecting unit 450 transmits the list of related applications (CORR_APPs) for the target application and the association indexes (RIs) indicating the association between the target application and the associated applications to the keyword analyzing unit 500, As shown in FIG.

이상, 도 5 내지 12를 참조하여, 연관 어플리케이션 결정부(400)가 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 획득하는 다양한 실시예들에 대해 설명하였으나, 본 발명은 이에 한정되지 않으며, 실시예들에 따라서 연관 어플리케이션 결정부(400)는 다양한 방식으로 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록(CORR_APPs)을 획득할 수 있다.5-12, description will be given of various embodiments in which the associated application determination unit 400 acquires a list (CORR_APPs) of associated applications having a high degree of association with the target application among the plurality of applications However, the present invention is not limited to this. According to embodiments, the associated application determination unit 400 may obtain a list (CORR_APPs) of related applications having a high degree of association with the target application in various ways.

다시 도 1 및 2를 참조하면, 키워드 분석부(500)는 연관 어플리케이션 결정부(400)로부터 상기 목표 어플리케이션에 대한 연관 어플리케이션들의 목록(CORR_APPs)을 수신할 수 있다.Referring again to FIGS. 1 and 2, the keyword analyzer 500 may receive a list (CORR_APPs) of related applications for the target application from the associated application determination unit 400.

또한, 실시예들에 따라서, 키워드 분석부(500)는 연관 어플리케이션 결정부(400)로부터 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들(RIs)을 더 수신할 수도 있다.In addition, according to embodiments, the keyword analyzing unit 500 may further receive association indexes (RIs) indicating the degree of association between the target application and the associated applications from the associated application determination unit 400. [

한편, 키워드 분석부(500)는 제1 데이터베이스(300)로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 키워드들(KW) 및 키워드들의 비중들(GV)을 독출할 수 있다(단계 S500).Meanwhile, the keyword analyzing unit 500 may read the specific gravity GVs of the keywords KW and keywords of the target application and the related applications from the first database 300 (step S500).

이후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)과 상기 연관 어플리케이션들 각각의 키워드들(KW)을 비교하여, 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 연관 어플리케이션들의 키워드들(KW)과 중복되는 키워드들을 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 중복 키워드가 아닌 키워드들을 비중복 키워드들로 결정할 수 있다(단계 S600).Thereafter, the keyword analyzing unit 500 compares the keywords KW of the target application with the keywords KW of the associated applications KW, (KW) as duplicate keywords, and determines keywords that are not duplicate keywords among the keywords KW of the target application as non-duplicated keywords (step S600).

예를 들어, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)과 상기 연관 어플리케이션들 중의 적어도 하나의 키워드들(KW)에 공통으로 포함되는 키워드들을 상기 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 중복 키워드가 아닌 키워드들을 비중복 키워드들로 결정할 수 있다.For example, the keyword analyzing unit 500 determines the keywords included in the keywords KW of the target application and the keywords KW of at least one of the related applications as the duplicate keywords, The non-duplicate keywords among the keywords KW of the target application can be determined as the non-duplicated keywords.

이후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)을 결정할 수 있다(단계 S700).The keyword analyzing unit 500 analyzes the keywords of the target application KW based on the weighted GVs of the target applications KW and the weighted GVs of the redundant keywords of the associated applications, KW) representative keywords (REP_KWs) representative of the target application (step S700).

도 13은 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계(S700)의 일 예를 나타내는 순서도이다.FIG. 13 is a flowchart illustrating a method of determining representative keywords representing the target application among the keywords of the target application (S700) based on the weight of the keywords of the target application of FIG. 2 and the weight of duplicate keywords of each of the associated applications; As shown in Fig.

도 13을 참조하면, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중(GV)에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중(GV)을 가중치로 적용하여 상기 중복 키워드의 점수를 결정할 수 있다(단계 S710).Referring to FIG. 13, the keyword analyzing unit 500 may calculate a weight (GV) of the duplicate keywords of the target application for each of the duplicated keywords among the keywords KW of the target application, The score of the duplicate keyword can be determined by applying the specific gravity GV of the duplicate keyword as a weight (step S710).

일 실시예에 있어서, 키워드 분석부(500)는 상기 연관 어플리케이션들의 상기 중복 키워드의 비중들(GV)의 합을 상기 목표 어플리케이션의 상기 중복 키워드의 비중(GV)과 합한 값을 상기 중복 키워드의 점수로 결정할 수 있다.In one embodiment, the keyword analyzing unit 500 may calculate a value obtained by adding a sum of the weights GV of the duplicate keywords of the associated applications to the specific gravity GV of the duplicate keyword of the target application, .

예를 들어, 상기 목표 어플리케이션의 제1 중복 키워드의 비중(GV)이 a1이고, 상기 연관 어플리케이션들 중에서 제1 내지 제3 연관 어플리케이션들이 상기 제1 중복 키워드를 포함하며, 상기 제1 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b1이고, 상기 제2 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b2이고, 상기 제3 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b3인 경우, 키워드 분석부(500)는 상기 목표 어플리케이션의 상기 제1 중복 키워드의 점수를 (a1+b1+b2+b3)로 결정할 수 있다.For example, if the specific gravity (GV) of the first duplicate keyword of the target application is a1, the first to third associated applications include the first duplicate keyword, The specific gravity GV of the first duplicate keyword is b1, the specific gravity GV of the first duplicate keyword of the second associated application is b2, and the specific gravity GV of the first duplicate keyword of the third related application is b3, the keyword analyzing unit 500 can determine the score of the first duplicate keyword of the target application as (a1 + b1 + b2 + b3).

한편, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중(GV)을 그대로 상기 비중복 키워드의 점수로 결정할 수 있다(단계 S730).On the other hand, the keyword analyzing unit 500 may calculate the specific gravity (GV) of the non-overlapping keyword of the target application as the score of the non-overlapping keyword for each of the non-overlapping keywords among the keywords KW of the target application (Step S730).

예를 들어, 상기 목표 어플리케이션의 제1 비중복 키워드의 비중이 c1이고, 상기 연관 어플리케이션들 중에서 상기 제1 비중복 키워드를 포함하는 연관 어플리케이션이 존재하지 않는 경우, 키워드 분석부(500)는 상기 목표 어플리케이션의 상기 제1 비중복 키워드의 점수를 c1로 결정할 수 있다.For example, if the weight of the first non-overlapping keyword of the target application is c1 and the associated application including the first non-overlapping keyword does not exist, the keyword analyzing unit 500 determines that the target The score of the first non-overlapping keyword of the application can be determined as c1.

상술한 바와 같은 방식으로 상기 목표 어플리케이션의 중복 키워드들 및 비중복 키워드들의 점수를 결정한 후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)로 결정할 수 있다(단계 S740).After determining the scores of the duplicate keywords and the non-overlapping keywords of the target application in the above-described manner, the keyword analyzer 500 searches the target application keywords (KW) (REP_KWs) representative of the application (step S740).

일 실시예에 있어서, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 점수가 높은 순서대로 미리 정해진 개수의 키워드들을 대표 키워드들(REP_KWs)로 결정할 수 있다.In one embodiment, the keyword analyzing unit 500 may determine a predetermined number of keywords as representative keywords REP_KWs in descending order of the scores KW of the target application.

다른 실시예에 있어서, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 문턱 점수보다 높은 점수를 갖는 키워드들을 대표 키워드들(REP_KWs)로 결정할 수 있다.In another embodiment, the keyword analyzing unit 500 may determine keywords having scores higher than the threshold score among the keywords KW of the target application as representative keywords REP_KWs.

도 13을 참조하여 상술한 바와 같이, 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)뿐만 아니라, 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)을 함께 고려하여 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)을 결정한다.As described above with reference to FIG. 13, the representative keyword determination system 10 of the application according to the embodiments of the present invention not only calculates the weight (GV) of the keywords KW of the target application, And representative keywords (REP_KWs) representative of the target application are determined in consideration of the respective weights (GV) of the respective redundant keywords.

따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10) 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 정확하게 결정할 수 있다.Therefore, the representative keyword determination system 10 of the application and the representative keyword determination method of the application according to the embodiments of the present invention can accurately determine representative keywords (REP_KWs) that effectively characterize the application.

도 14는 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계(S700)의 다른 예를 나타내는 순서도이다.FIG. 14 is a flowchart illustrating a process of determining representative keywords representing the target application among the keywords of the target application (S700) based on the weight of the keywords of the target application of FIG. 2 and the weight of duplicate keywords of each of the related applications; Fig.

도 14를 참조하면, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중(GV)에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중(GV) 및 상기 연관 어플리케이션들 각각의 연관 지수(RI)를 가중치로 적용하여 상기 중복 키워드의 점수를 결정할 수 있다(단계 S720).Referring to FIG. 14, the keyword analyzing unit 500 may calculate, for each of the duplicate keywords among the keywords KW of the target application, the specific gravity GV of the duplicate keyword of the target application, In step S720, the score of the duplicate keyword may be determined by applying the weight of the duplicate keyword GV and the association index RI of each of the related applications as weights.

일 실시예에 있어서, 키워드 분석부(500)는 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중(GV)과 상기 연관 어플리케이션들 각각의 연관 지수(RI)의 곱을 상기 목표 어플리케이션의 상기 중복 키워드의 비중(GV)과 합한 값을 상기 중복 키워드의 점수로 결정할 수 있다.In one embodiment, the keyword analyzing unit 500 may calculate the product of the weight of the duplicate keyword (GV) of each of the associated applications and the association index (RI) of each of the associated applications, (GV) may be determined as the score of the duplicate keyword.

예를 들어, 상기 목표 어플리케이션의 제1 중복 키워드의 비중(GV)이 a1이고, 상기 연관 어플리케이션들 중에서 제1 내지 제3 연관 어플리케이션들이 상기 제1 중복 키워드를 포함하며, 상기 제1 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b1이고, 상기 제1 연관 어플리케이션의 연관 지수(RI)가 r1이고, 상기 제2 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b2이고, 상기 제2 연관 어플리케이션의 연관 지수(RI)가 r2이고, 상기 제3 연관 어플리케이션의 상기 제1 중복 키워드의 비중(GV)이 b3이고, 상기 제3 연관 어플리케이션의 연관 지수(RI)가 r3인 경우, 키워드 분석부(500)는 상기 목표 어플리케이션의 상기 제1 중복 키워드의 점수를 (a1 + b1*r1 + b2*r2 + b3*r3)로 결정할 수 있다.For example, if the specific gravity (GV) of the first duplicate keyword of the target application is a1, the first to third associated applications include the first duplicate keyword, The specific weight (GV) of the first duplicate keyword is b1, the association index (RI) of the first associated application is r1, the specific gravity (GV) of the first duplicate keyword of the second associated application is b2, When the association index (RI) of the second associated application is r2, the specific gravity (GV) of the first duplicate keyword of the third associated application is b3, and the association index (RI) of the third associated application is r3, The analyzer 500 may determine the score of the first duplicate keyword in the target application as (a1 + b1 * r1 + b2 * r2 + b3 * r3).

한편, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상기 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중(GV)을 그대로 상기 비중복 키워드의 점수로 결정할 수 있다(단계 S730).On the other hand, the keyword analyzing unit 500 may calculate the specific gravity (GV) of the non-overlapping keyword of the target application as the score of the non-overlapping keyword for each of the non-overlapping keywords among the keywords KW of the target application (Step S730).

예를 들어, 상기 목표 어플리케이션의 제1 비중복 키워드의 비중이 c1이고, 상기 연관 어플리케이션들 중에서 상기 제1 비중복 키워드를 포함하는 연관 어플리케이션이 존재하지 않는 경우, 키워드 분석부(500)는 상기 목표 어플리케이션의 상기 제1 비중복 키워드의 점수를 c1로 결정할 수 있다.For example, if the weight of the first non-overlapping keyword of the target application is c1 and the associated application including the first non-overlapping keyword does not exist, the keyword analyzing unit 500 determines that the target The score of the first non-overlapping keyword of the application can be determined as c1.

상술한 바와 같은 방식으로 상기 목표 어플리케이션의 중복 키워드들 및 비중복 키워드들의 점수를 결정한 후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)로 결정할 수 있다(단계 S740).After determining the scores of the duplicate keywords and the non-overlapping keywords of the target application in the above-described manner, the keyword analyzer 500 searches the target application keywords (KW) (REP_KWs) representative of the application (step S740).

도 14를 참조하여 상술한 바와 같이, 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)뿐만 아니라, 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)과 상기 연관 어플리케이션들의 연관 지수들(RIs)을 함께 고려하여 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)을 결정한다.As described above with reference to FIG. 14, the representative keyword determination system 10 of the application according to the embodiments of the present invention not only calculates the weight (GV) of the keywords KW of the target application, The representative keywords REP_KWs representative of the target application are determined in consideration of the weight of each of the redundant keywords GV and the association indexes RIs of the related applications.

따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10) 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 더욱 정확하게 결정할 수 있다.Therefore, the representative keyword determination system 10 of the application and the representative keyword determination method of the application according to the embodiments of the present invention can more accurately determine representative keywords (REP_KWs) that effectively characterize the application.

도 15는 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계(S700)의 또 다른 예를 나타내는 순서도이다.FIG. 15 is a flowchart illustrating a process of determining representative keywords representing the target application among the keywords of the target application (S700) based on the weight of the keywords of the target application of FIG. 2 and the weight of duplicate keywords of each of the related applications; As shown in Fig.

도 15를 참조하면, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 각각의 점수를 결정할 수 있다(단계 S701).Referring to FIG. 15, the keyword analyzing unit 500 analyzes the target application KV based on the weighted GVs of the keywords KW of the target application and the weighted GVs of the redundant keywords of each of the associated applications, The score of each of the keywords KW of the user can be determined (step S701).

일 실시예에 있어서, 키워드 분석부(500)는 도 13을 참조하여 상술한 바와 같은 방법으로 상기 목표 어플리케이션의 상기 중복 키워드들 각각의 점수 및 상기 목표 어플리케이션의 상기 비중복 키워드들 각각의 점수를 결정할 수 있다.In one embodiment, the keyword analysis unit 500 determines the score of each of the duplicate keywords of the target application and the score of each of the non-overlapping keywords of the target application in the manner described above with reference to FIG. 13 .

다른 실시예에 있어서, 키워드 분석부(500)는 도 14를 참조하여 상술한 바와 같은 방법으로 상기 목표 어플리케이션의 상기 중복 키워드들 각각의 점수 및 상기 목표 어플리케이션의 상기 비중복 키워드들 각각의 점수를 결정할 수 있다.In another embodiment, the keyword analysis unit 500 determines the score of each of the duplicate keywords of the target application and the score of each of the non-overlapping keywords of the target application in the manner described above with reference to Fig. 14 .

이후, 키워드 분석부(500)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드들(KW) 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 각각의 보정 계수를 결정할 수 있다(단계 S750).Then, the keyword analyzing unit 500 analyzes the number of the keywords included in the target application KW based on the number of applications including the keywords overlapping each of the keywords KW of the target application among the plurality of applications stored in the first database 300 The correction coefficient of each of the keywords KW can be determined (step S750).

예를 들어, 키워드 분석부(500)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드(KW)와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 키워드(KW)의 상기 보정 계수를 상대적으로 작은 값으로 결정하고, 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드(KW)와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 키워드(KW)의 상기 보정 계수를 상대적으로 큰 값으로 결정할 수 있다.For example, if the number of applications having the same keyword as the keyword KW of the target application among the plurality of applications stored in the first database 300 is relatively large, The correction coefficient of the application keyword KW is determined to be a relatively small value and the number of applications including the keyword identical to the keyword KW of the target application among the plurality of applications stored in the first database 300 Is relatively small, the correction coefficient of the keyword (KW) of the target application can be determined to be a relatively large value.

이후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 각각의 상기 점수에 상기 목표 어플리케이션의 키워드들(KW) 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 키워드들(KW) 각각의 보정 점수로 결정하고(단계 S770), 상기 목표 어플리케이션의 키워드들(KW) 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)로 결정할 수 있다(단계 S780).Then, the keyword analyzing unit 500 compares the score of each of the keywords KW of the target application with the correction coefficient of each of the keywords KW of the target application to the keywords KW of the target application, (Step S770), and determines keywords having a relatively higher correction score among the keywords KW of the target application as representative keywords REP_KWs representative of the target application (step S780) ).

일반적으로 "권한", "결제" 등과 같이 다양한 어플리케이션들의 설명 자료(DS)에서 공통으로 사용되는 일반적인 단어들은 특정 어플리케이션의 특징이나 기능을 효과적으로 나타낼 수 없다.Generally, common words commonly used in DSs of various applications such as "authority "," settlement ", etc. can not effectively represent characteristics or functions of a specific application.

도 15를 참조하여 상술한 바와 같이, 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 보정 계수를 통해 "권한", "결제" 등과 같이 다양한 어플리케이션들의 설명 자료(DS)에서 공통으로 사용되는 일반적인 키워드의 점수를 감소시켜 상기 보정 점수를 결정하므로, 범용적인 키워드가 상기 목표 어플리케이션의 대표 키워드(REP_KWs)로 결정되는 것을 효과적으로 방지할 수 있다.As described above with reference to Fig. 15, the representative keyword determination system 10 of the application according to the embodiments of the present invention can use the correction coefficient to determine description data DS of various applications such as " It is possible to effectively prevent general keywords from being determined as the representative keywords (REP_KWs) of the target application.

따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10) 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 더욱 정확하게 결정할 수 있다.Therefore, the representative keyword determination system 10 of the application and the representative keyword determination method of the application according to the embodiments of the present invention can more accurately determine representative keywords (REP_KWs) that effectively characterize the application.

도 16은 도 2의 목표 어플리케이션의 키워드들의 비중들과 연관 어플리케이션들 각각의 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계(S700)의 또 다른 예를 나타내는 순서도이다.FIG. 16 is a flowchart illustrating a method of determining representative keywords representative of the target application among the keywords of the target application (S700) based on the weight of the keywords of the target application of FIG. 2 and the weight of duplicate keywords of each of the related applications; As shown in Fig.

도 16을 참조하면, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW)의 비중들(GV)과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들(GV)에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 각각의 점수를 결정할 수 있다(단계 S701).Referring to FIG. 16, the keyword analyzing unit 500 analyzes the target application (GW) based on the GWs of the keywords KW of the target application and the GVs of the redundant keywords of the respective applications, The score of each of the keywords KW of the user can be determined (step S701).

일 실시예에 있어서, 키워드 분석부(500)는 도 13을 참조하여 상술한 바와 같은 방법으로 상기 목표 어플리케이션의 상기 중복 키워드들 각각의 점수 및 상기 목표 어플리케이션의 상기 비중복 키워드들 각각의 점수를 결정할 수 있다.In one embodiment, the keyword analysis unit 500 determines the score of each of the duplicate keywords of the target application and the score of each of the non-overlapping keywords of the target application in the manner described above with reference to FIG. 13 .

다른 실시예에 있어서, 키워드 분석부(500)는 도 14를 참조하여 상술한 바와 같은 방법으로 상기 목표 어플리케이션의 상기 중복 키워드들 각각의 점수 및 상기 목표 어플리케이션의 상기 비중복 키워드들 각각의 점수를 결정할 수 있다.In another embodiment, the keyword analysis unit 500 determines the score of each of the duplicate keywords of the target application and the score of each of the non-overlapping keywords of the target application in the manner described above with reference to Fig. 14 .

일 실시예에 있어서, 어플리케이션 마켓(20)으로부터 크롤링되는 상기 복수의 어플리케이션들 각각의 설명 자료(DS)는 상기 복수의 어플리케이션들의 카테고리 정보를 포함할 수 있다.In one embodiment, the description data DS of each of the plurality of applications crawled from the application market 20 may include category information of the plurality of applications.

이 경우, 키워드 추출부(200)는 상기 복수의 어플리케이션들 각각의 설명 자료(DS)에 기초하여 상기 복수의 어플리케이션들 각각의 상기 카테고리 정보를 제1 데이터베이스(300)에 추가적으로 저장할 수 있다.In this case, the keyword extracting unit 200 may additionally store the category information of each of the plurality of applications in the first database 300 based on the description data DS of each of the plurality of applications.

도 17은 도 1의 어플리케이션의 대표 키워드 결정 시스템에 포함되는 제1 데이터베이스의 다른 예를 나타내는 도면이다.17 is a diagram showing another example of the first database included in the representative keyword determination system of the application of FIG.

도 17을 참조하면, 제1 데이터베이스(300b)는 어플리케이션 필드(APP_F), 카테고리 필드(CATEGORY_F), 키워드 필드(KW_F), 및 비중 필드(GV_F)를 포함할 수 있다.Referring to FIG. 17, the first database 300b may include an application field APP_F, a category field CATEGORY_F, a keyword field KW_F, and a specific gravity field GV_F.

키워드 추출부(200)는 상기 복수의 어플리케이션들 각각에 대하여, 어플리케이션의 명칭(APP_N)을 어플리케이션 필드(APP_F)에 저장하고, 상응하는 어플리케이션의 카테고리를 카테고리 필드(CATEGORY_F)에 저장하고, 상응하는 어플리케이션의 키워드들(KW)을 키워드 필드(KW_F)에 저장하고, 상응하는 어플리케이션의 키워드들(KW)의 비중들(GV)을 비중 필드(GV_F)에 저장할 수 있다.The keyword extracting unit 200 stores the name (APP_N) of the application in the application field (APP_F) for each of the plurality of applications, stores the category of the corresponding application in the category field (CATEGORY_F) The keywords KW of the corresponding application KW can be stored in the keyword field KW_F and the specific gravity GV of the corresponding application keywords KW can be stored in the gravity field GV_F.

도 17에는 예시적으로 APP1에 상응하는 어플리케이션의 카테고리는 "커뮤니케이션"이고, APP1에 상응하는 어플리케이션의 키워드들(KW)은 "대화", "친구", 및 "첨부"로 결정되고, APP1에 상응하는 어플리케이션에서 "대화", "친구", 및 "첨부"의 비중(GV)은 각각 "0.40", "0.35", 및 "0.25"로 결정되고, APP2에 상응하는 어플리케이션의 카테고리는 "출산"이고, APP2에 상응하는 어플리케이션의 키워드들(KW)은 "임신", "태교", "다이어리", 및 "영양"으로 결정되고, APP2에 상응하는 어플리케이션에서 "임신", "태교", "다이어리", 및 "영양"의 비중(GV)은 각각 "0.45", "0.30", "0.15", 및 "0.10"으로 결정된 것을 나타낸다.17, the category of the application corresponding to APP1 is "communication", the keywords KW of the application corresponding to APP1 are determined as "conversation", "friend", and "attachment" 0.35 " and "0.25 ", respectively, and the category of the application corresponding to APP2 is" birth " , The keywords KW of the application corresponding to APP2 are determined as "pregnancy", "fetish", "diary", and "nutrition", and "pregnancy", " , And the "specific gravity" (GV) of "nutrition" were determined as "0.45", "0.30", "0.15", and "0.10", respectively.

이 경우, 도 16에 도시된 바와 같이, 키워드 추출부(200)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드들(KW) 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 키워드들(KW) 각각의 보정 계수를 결정할 수 있다(단계 S760).In this case, as shown in FIG. 16, the keyword extracting unit 200 extracts, from among the plurality of applications stored in the first database 300, an application including keywords overlapping each of the keywords KW of the target application (KW) of the target application based on the number of categories to which the target application belongs (step S760).

예를 들어, 키워드 분석부(500)는 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드(KW)와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 키워드(KW)의 상기 보정 계수를 상대적으로 작은 값으로 결정하고, 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 키워드(KW)와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 키워드(KW)의 상기 보정 계수를 상대적으로 큰 값으로 결정할 수 있다.For example, when the number of categories to which the applications including the keyword (KW) of the target application belongs is relatively large among the plurality of applications stored in the first database 300 , Determines the correction coefficient of the keyword (KW) of the target application to be a relatively small value, and determines the correction coefficient of the keyword (KW) of the target application as a relatively small value, When the number of categories to which the applications belong is relatively small, the correction coefficient of the keyword (KW) of the target application can be determined to be a relatively large value.

이후, 키워드 분석부(500)는 상기 목표 어플리케이션의 키워드들(KW) 각각의 상기 점수에 상기 목표 어플리케이션의 키워드들(KW) 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 키워드들(KW) 각각의 보정 점수로 결정하고(단계 S770), 상기 목표 어플리케이션의 키워드들(KW) 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 목표 어플리케이션을 대표하는 대표 키워드들(REP_KWs)로 결정할 수 있다(단계 S780).Then, the keyword analyzing unit 500 compares the score of each of the keywords KW of the target application with the correction coefficient of each of the keywords KW of the target application to the keywords KW of the target application, (Step S770), and determines keywords having a relatively higher correction score among the keywords KW of the target application as representative keywords REP_KWs representative of the target application (step S780) ).

일반적으로 "권한", "결제" 등과 같이 다양한 종류의 카테고리들에 속하는 어플리케이션들의 설명 자료(DS)에서 공통으로 사용되는 일반적인 단어들은 특정 어플리케이션의 특징이나 기능을 효과적으로 나타낼 수 없다.Generally, common words commonly used in description data (DS) of applications belonging to various categories of categories such as "authority" and "settlement" can not effectively represent the characteristics or functions of a specific application.

도 16 및 17을 참조하여 상술한 바와 같이, 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 상기 보정 계수를 통해 "권한", "결제" 등과 같이 다양한 종류의 카테고리들에 속하는 어플리케이션들의 설명 자료(DS)에서 공통으로 사용되는 일반적인 키워드의 점수를 감소시켜 상기 보정 점수를 결정하므로, 범용적인 키워드가 상기 목표 어플리케이션의 대표 키워드(REP_KWs)로 결정되는 것을 효과적으로 방지할 수 있다.As described above with reference to Figs. 16 and 17, the representative keyword determination system 10 of the application according to the embodiments of the present invention may be configured to determine the category of the category, such as " It is possible to effectively prevent general keywords from being determined as the representative keywords (REP_KWs) of the target application by decreasing the scores of common keywords commonly used in the description data DS of the applications to which the application belongs.

따라서 본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10) 및 어플리케이션의 대표 키워드 결정 방법은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들(REP_KWs)을 더욱 정확하게 결정할 수 있다.Therefore, the representative keyword determination system 10 of the application and the representative keyword determination method of the application according to the embodiments of the present invention can more accurately determine representative keywords (REP_KWs) that effectively characterize the application.

본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)은 제1 데이터베이스(300)에 저장된 상기 복수의 어플리케이션들 각각을 순차적으로 상기 목표 어플리케이션으로 선택하고, 상기 선택된 목표 어플리케이션에 대해 도 1 내지 17을 참조하여 상술한 바와 같은 동작을 반복적으로 수행함으로써, 상기 복수의 어플리케이션들 각각의 대표 키워드들(REP_KWs)을 결정할 수 있다.The representative keyword determination system 10 of the application according to the embodiments of the present invention sequentially selects each of the plurality of applications stored in the first database 300 as the target application, The representative keywords (REP_KWs) of each of the plurality of applications can be determined by repeatedly performing the operations described above with reference to FIGS.

본 발명의 실시예들에 따른 어플리케이션의 대표 키워드 결정 시스템(10)을 통해 결정되는 상기 복수의 어플리케이션들 각각의 대표 키워드들(REP_KWs)은 어플리케이션의 검색, 광고 등과 같은 다양한 분야에서 유용하게 활용될 수 있다.The representative keywords (REP_KWs) of each of the plurality of applications determined through the representative keyword determination system 10 of the application according to the embodiments of the present invention can be utilized in various fields such as searching for an application, have.

본 발명은 어플리케이션의 특징을 효과적으로 나타내는 대표 키워드들을 정확하게 결정할 수 있으므로, 어플리케이션 검색의 편의성을 향상시키고, 어플리케이션의 광고 대상을 선별하는 데에 유용하게 이용될 수 있다.INDUSTRIAL APPLICABILITY The present invention can accurately determine representative keywords that effectively characterize an application, and thus can be used to improve the convenience of application search and to select an advertisement object of an application.

상술한 바와 같이, 본 발명의 바람직한 실시예를 참조하여 설명하였지만 해당 기술 분야에서 통상의 지식을 가진 자라면 하기의 특허청구범위에 기재된 본 발명의 사상 및 영역으로부터 벗어나지 않는 범위 내에서 본 발명을 다양하게 수정 및 변경시킬 수 있음을 이해할 수 있을 것이다.Although the preferred embodiments of the present invention have been disclosed for illustrative purposes, those skilled in the art will appreciate that various modifications, additions and substitutions are possible, without departing from the scope and spirit of the invention as disclosed in the accompanying claims. It will be understood that the invention may be modified and varied without departing from the scope of the invention.

10: 어플리케이션의 대표 키워드 결정 시스템
20: 어플리케이션 마켓 30: 모바일 단말기
100: 설명 자료 수집부 200: 키워드 추출부
300: 제1 데이터베이스 400: 연관 어플리케이션 결정부
410: 데이터 수신부 420: 제3 데이터베이스
430: 비율 계산부 440: 연관도 분석부
450: 연관 어플리케이션 선택부 500: 키워드 분석부
600: 제2 데이터베이스
10: Application's representative keyword determination system
20: Application Market 30: Mobile Terminal
100: description data collecting unit 200: keyword extracting unit
300: First database 400: Associated application determining unit
410: Data receiving unit 420: Third database
430: ratio calculation unit 440: relevance analysis unit
450: Associated application selection unit 500: Keyword analysis unit
600: second database

Claims (20)

어플리케이션 마켓으로부터 복수의 어플리케이션들 각각의 설명 자료를 크롤링(crawling)하는 단계;
상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 제1 데이터베이스에 저장하는 단계;
상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택하는 단계;
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 단계;
상기 제1 데이터베이스로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 상기 키워드들 및 상기 키워드들의 비중들을 독출하는 단계;
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 연관 어플리케이션들의 상기 키워드들과 중복되는 키워드들을 중복 키워드들로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
Crawling description data of each of a plurality of applications from an application market;
Determining, for each of the plurality of applications, the weight of the keywords in the description data and the keywords included in the description data and storing the determined weight in the first database;
Selecting a target application among the plurality of applications;
Obtaining a list of associated applications having a high degree of association with the target application among the plurality of applications;
Reading the weight of the keywords and the keywords of each of the target application and the associated applications from the first database;
Determining duplicated keywords as duplicate keywords among the keywords of the associated applications among the keywords of the target application; And
Determining representative keywords representative of the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications How to determine representative keywords.
제1 항에 있어서, 상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 상기 키워드들 및 상기 설명 자료에서 상기 키워드들의 상기 비중들을 결정하여 상기 제1 데이터베이스에 저장하는 단계는,
상기 복수의 어플리케이션들 각각에 대하여,
상기 설명 자료에 대해 형태소 분석(morphological analysis)을 수행하여 상기 설명 자료에 포함되는 상기 키워드들을 추출하는 단계;
상기 설명 자료에서 상기 키워드들 각각의 반복 횟수를 결정하는 단계;
상기 키워드들 각각의 상기 반복 횟수를 상기 키워드들의 상기 반복 횟수들의 총합으로 나눈 값을 상기 키워드들 각각의 상기 비중으로 결정하는 단계; 및
상기 키워드들 및 상기 키워드들의 상기 비중들을 상응하는 어플리케이션의 명칭과 연관시켜 상기 제1 데이터베이스에 저장하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
2. The method of claim 1, wherein for each of the plurality of applications, determining the weight of the keywords from the keywords included in the description data and the description data and storing the determined weight in the first database comprises:
For each of the plurality of applications,
Performing morphological analysis on the explanatory data to extract the keywords included in the explanatory data;
Determining the number of repetitions of each of the keywords in the description data;
Determining a value obtained by dividing the repetition count of each of the keywords by the total of the repetition counts of the keywords as the weight of each of the keywords; And
And associating the weight of the keywords and the keywords with a name of a corresponding application and storing the keyword in the first database.
제1 항에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는,
상기 복수의 어플리케이션들 각각에 대하여, 상응하는 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 미리 저장하는 제2 데이터베이스로부터 상기 목표 어플리케이션에 상응하는 상기 연관 어플리케이션들의 목록을 독출하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
The method of claim 1, wherein the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications comprises:
Reading, for each of the plurality of applications, a list of the associated applications corresponding to the target application from a second database that stores in advance a list of the associated applications having a high degree of association with the corresponding application A method for determining representative keywords of an application.
제1 항에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는,
복수의 모바일 단말기들 각각의 식별 아이디 및 상기 복수의 모바일 단말기들 각각에 설치된 어플리케이션들의 목록을 포함하는 설치 로그 데이터를 수신하여 제3 데이터베이스에 저장하는 단계;
상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들 중에서 제1 내지 제k(k는 양의 정수) 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 전체 비율들을 결정하는 단계;
상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 제1 내지 제k 교차 비율들을 결정하는 단계;
상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 제1 내지 제k 연관 지수들을 결정하는 단계; 및
상기 제1 내지 제k 어플리케이션들 중에서 상대적으로 높은 연관 지수를 갖는 어플리케이션들을 상기 연관 어플리케이션들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
The method of claim 1, wherein the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications comprises:
Receiving installation log data including an identification ID of each of the plurality of mobile terminals and a list of applications installed in each of the plurality of mobile terminals, and storing the received installation log data in a third database;
(K is a positive integer) applications among the plurality of mobile terminals based on the installation log data of the plurality of mobile terminals stored in the third database Determining first through kth total ratios;
K-th applications corresponding to the ratios of the mobile terminals in which the first to k-th applications are installed, among the mobile terminals in which the target application is installed, based on the installation log data of the plurality of mobile terminals stored in the third database k crossing ratios;
Determining first to k < th > k association indices indicative of a degree of association between the target application and each of the first to k-th applications based on the first to k-th overall ratios and the first to k- ; And
And determining, as the related applications, applications having a relatively high association index among the first to k-th applications.
제4 항에 있어서, 상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 상기 제1 내지 제k 전체 비율들을 결정하는 단계는,
상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 복수의 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 전체 개수로 결정하는 단계;
상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 제j(j는 1 이상 k 이하의 임의의 양의 정수) 어플리케이션이 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 제j 설치 개수로 결정하는 단계; 및
상기 제j 설치 개수를 상기 전체 개수로 나눈 값을 제j 전체 비율로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
5. The method according to claim 4, further comprising the step of, based on the installation log data of the plurality of mobile terminals stored in the third database, Wherein determining the first through k < RTI ID = 0.0 > k <
Determining a total number of the identification IDs corresponding to the plurality of mobile terminals based on the installation log data of the plurality of mobile terminals;
Determining a number of the identification IDs corresponding to mobile terminals provided with an application of j (j is an arbitrary positive integer equal to or greater than 1 k) based on the installation log data of the plurality of mobile terminals as a j-th installation number ; And
Determining a value obtained by dividing the number of the j-th installation by the total number as a j-th overall ratio.
제4 항에 있어서, 상기 제3 데이터베이스에 저장된 상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들 중에서 상기 제1 내지 제k 어플리케이션들 각각이 설치된 모바일 단말기들의 비율에 상응하는 상기 제1 내지 제k 교차 비율들을 결정하는 단계는,
상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션이 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 목표 설치 개수로 결정하는 단계;
상기 복수의 모바일 단말기들의 상기 설치 로그 데이터에 기초하여 상기 목표 어플리케이션과 제j(j는 1 이상 k 이하의 임의의 양의 정수) 어플리케이션이 함께 설치된 모바일 단말기들에 상응하는 상기 식별 아이디들의 개수를 제j 교차 개수로 결정하는 단계; 및
상기 제j 교차 개수를 상기 목표 설치 개수로 나눈 값을 제j 교차 비율로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
5. The method according to claim 4, further comprising the steps of: determining, based on the installation log data of the plurality of mobile terminals stored in the third database, a ratio of mobile terminals installed with the first to k- The step of determining corresponding first through kth intersection ratios comprises:
Determining, as a target installation number, the number of the identification IDs corresponding to the mobile terminals on which the target application is installed based on the installation log data of the plurality of mobile terminals;
(J is a positive integer equal to or less than k) applications based on the installation log data of the plurality of mobile terminals, the number of the identification IDs corresponding to mobile terminals installed together with the target application and the j j as a number of intersections; And
Determining a value obtained by dividing the j-th intersection number by the target installed number as a j-th intersection ratio.
제4 항에 있어서, 상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는,
상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
5. The method of claim 4, further comprising: determining whether the target application and the first to k-th applications are associated with each other based on the first through k < 0.0 > k < / RTI > association indexes,
And determining the first through k-th associated indexes based on a difference between each of the first through k-th overall ratios and each of the first through k-th crossing ratios.
제4 항에 있어서, 상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는,
상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
5. The method of claim 4, further comprising: determining whether the target application and the first to k-th applications are associated with each other based on the first through k < 0.0 > k < / RTI > association indexes,
And determining the first through k k-related indexes based on a ratio of each of the first through k-th crossing ratios for each of the first through k-th overall ratios.
제4 항에 있어서, 상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는,
상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이 및 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
5. The method of claim 4, further comprising: determining whether the target application and the first to k-th applications are associated with each other based on the first through k < 0.0 > k < / RTI > association indexes,
The ratio of each of the first through kth total ratios and each of the first through kth intersection ratios to each of the first through kth total ratios, And determining the first through k < th > k-related indexes based on the first through k-th associated indexes.
제4 항에 있어서, 상기 제1 내지 제k 전체 비율들 및 상기 제1 내지 제k 교차 비율들에 기초하여 상기 목표 어플리케이션과 상기 제1 내지 제k 어플리케이션들 각각 사이의 연관도를 나타내는 상기 제1 내지 제k 연관 지수들을 결정하는 단계는,
상기 제1 내지 제k 전체 비율들 각각과 상기 제1 내지 제k 교차 비율들 각각 사이의 차이, 상기 제1 내지 제k 전체 비율들 각각에 대한 상기 제1 내지 제k 교차 비율들 각각의 비율, 및 0보다 크고 1보다 작은 값을 갖는 가중치에 기초하여 상기 제1 내지 제k 연관 지수들을 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
5. The method of claim 4, further comprising: determining whether the target application and the first to k-th applications are associated with each other based on the first through k < 0.0 > k < / RTI > association indexes,
A ratio of each of the first through k-th total ratios and a difference between each of the first through k-th intersection ratios, a ratio of each of the first through k-th intersection ratios to each of the first through k- And determining the first through k-th associated indexes based on a weight having a value greater than zero and less than one.
제1 항에 있어서, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는,
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중을 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계;
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드가 아닌 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중을 상기 비중복 키워드의 점수로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
The method of claim 1, further comprising: determining the representative keywords representing the target application from among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications Lt; / RTI >
For each of the duplicate keywords among the keywords of the target application, a weight of the duplicate keyword is determined by applying a weight of the duplicate keyword of each of the associated applications to a weight of the duplicate keyword of the target application step;
Determining a weight of the non-overlapping keyword of the target application as the score of the non-overlapping keyword, for each of the non-overlapping keywords that are not duplicate keywords among the keywords of the target application; And
And determining, as the representative keywords, keywords having a relatively high score among the keywords of the target application.
제11 항에 있어서, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중을 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계는,
상기 연관 어플리케이션들의 상기 중복 키워드의 비중들의 합을 상기 목표 어플리케이션의 상기 중복 키워드의 비중과 합한 값을 상기 중복 키워드의 점수로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
12. The method of claim 11, wherein for each of the duplicate keywords among the keywords in the target application, a weight of the duplicate keyword of each of the associated applications is applied as a weight to a weight of the duplicate keyword of the target application, The step of determining the score of the keyword comprises:
Determining a sum of the weights of the duplicate keywords of the associated applications and a weight of the duplicate keyword of the target application as a score of the duplicate keyword.
제1 항에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 상기 연관 어플리케이션들의 목록을 획득하는 단계는,
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 상대적으로 높은 연관도를 갖는 어플리케이션들에 상응하는 상기 연관 어플리케이션들의 목록 및 상기 목표 어플리케이션과 상기 연관 어플리케이션들 사이의 연관도를 나타내는 연관 지수들을 획득하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
The method of claim 1, wherein the step of obtaining a list of the associated applications having a high degree of association with the target application among the plurality of applications comprises:
Obtaining a list of the associated applications corresponding to applications having a relatively high degree of association with the target application among the plurality of applications and association indexes indicating association degrees between the target applications and the associated applications A method for determining representative keywords of an application.
제13 항에 있어서, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는,
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중 및 상기 연관 어플리케이션들 각각의 상기 연관 지수를 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계;
상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드가 아닌 비중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 비중복 키워드의 비중을 상기 비중복 키워드의 점수로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
14. The method of claim 13, further comprising determining the representative keywords representing the target application from the keywords of the target application based on the weight of the keywords in the target application and the weight of the duplicate keywords in each of the associated applications Lt; / RTI >
For each of the duplicate keywords among the keywords of the target application, a weight of the duplicate keyword of each of the associated applications and a weight of the association index of each of the associated applications in the weight of the duplicate keyword of the target application Determining a score of the duplicate keyword;
Determining a weight of the non-overlapping keyword of the target application as the score of the non-overlapping keyword, for each of the non-overlapping keywords that are not duplicate keywords among the keywords of the target application; And
And determining, as the representative keywords, keywords having a relatively high score among the keywords of the target application.
제14 항에 있어서, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 중복 키워드들 각각에 대하여, 상기 목표 어플리케이션의 상기 중복 키워드의 비중에 상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중 및 상기 연관 어플리케이션들 각각의 상기 연관 지수를 가중치로 적용하여 상기 중복 키워드의 점수를 결정하는 단계는,
상기 연관 어플리케이션들 각각의 상기 중복 키워드의 비중과 상기 연관 어플리케이션들 각각의 상기 연관 지수의 곱을 상기 목표 어플리케이션의 상기 중복 키워드의 비중과 합한 값을 상기 중복 키워드의 점수로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
15. The method of claim 14, further comprising: for each of the duplicate keywords among the keywords in the target application, the weight of the duplicate keyword of each of the associated applications in the weight of the duplicate keyword in the target application, The step of determining the score of the duplicate keyword by applying the association index as a weight,
Determining a sum of the weight of the duplicate keyword of each of the related applications and the association index of each of the associated applications together with the weight of the duplicate keyword of the target application as the score of the duplicate keyword How to determine representative keywords.
제1 항에 있어서, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는,
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 점수를 결정하는 단계;
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 계수를 결정하는 단계;
상기 목표 어플리케이션의 상기 키워드들 각각의 상기 점수에 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 점수로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
The method of claim 1, further comprising: determining the representative keywords representing the target application from among the keywords of the target application based on the weight of the keywords of the target application and the weight of the duplicate keywords of each of the associated applications Lt; / RTI >
Determining a score of each of the keywords in the target application based on the weight of the keywords in the target application and the weight of the duplicate keywords in each of the associated applications;
Determining a correction coefficient of each of the keywords of the target application based on the number of applications including a keyword overlapping each of the keywords of the target application among the plurality of applications;
Determining a value obtained by multiplying the score of each of the keywords of the target application by the correction coefficient of each of the keywords of the target application as a correction score of each of the keywords of the target application; And
And determining, as the representative keywords, keywords having a relatively high correction score among the keywords of the target application.
제16 항에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 결정하는 단계는,
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 작은 값으로 결정하는 단계; 및
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 큰 값으로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
17. The method of claim 16, wherein determining the correction factor for each of the keywords of the target application based on a number of applications that include a keyword overlapping each of the keywords of the target application among the plurality of applications ,
Determining the correction coefficient of the keyword of the target application as a relatively small value when the number of applications including the same keyword as the keyword of the target application is relatively large among the plurality of applications; And
Determining the correction coefficient of the keyword of the target application to be a relatively large value when the number of applications including the same keyword as the keyword of the target application is relatively small among the plurality of applications, ≪ / RTI >
제1 항에 있어서,
상기 복수의 어플리케이션들 각각의 상기 설명 자료에 기초하여 상기 복수의 어플리케이션들 각각의 카테고리 정보를 상기 제1 데이터베이스에 저장하는 단계를 더 포함하고,
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 상기 대표 키워드들을 결정하는 단계는,
상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 점수를 결정하는 단계;
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 계수를 결정하는 단계;
상기 목표 어플리케이션의 상기 키워드들 각각의 상기 점수에 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 곱한 값을 상기 목표 어플리케이션의 상기 키워드들 각각의 보정 점수로 결정하는 단계; 및
상기 목표 어플리케이션의 상기 키워드들 중에서 상대적으로 높은 보정 점수를 갖는 키워드들을 상기 대표 키워드들로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
The method according to claim 1,
Further comprising storing the category information of each of the plurality of applications in the first database based on the description data of each of the plurality of applications,
The step of determining the representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the redundant keywords of each of the related applications,
Determining a score of each of the keywords in the target application based on the weight of the keywords in the target application and the weight of the duplicate keywords in each of the associated applications;
Determining a correction coefficient of each of the keywords of the target application based on the number of categories to which applications including keywords overlapping each of the keywords of the target application among the plurality of applications belong;
Determining a value obtained by multiplying the score of each of the keywords of the target application by the correction coefficient of each of the keywords of the target application as a correction score of each of the keywords of the target application; And
And determining, as the representative keywords, keywords having a relatively high correction score among the keywords of the target application.
제18 항에 있어서, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드들 각각과 중복되는 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수에 기초하여 상기 목표 어플리케이션의 상기 키워드들 각각의 상기 보정 계수를 결정하는 단계는,
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 많은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 작은 값으로 결정하는 단계; 및
상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션의 상기 키워드와 동일한 키워드를 포함하는 어플리케이션들이 속하는 카테고리들의 개수가 상대적으로 적은 경우, 상기 목표 어플리케이션의 상기 키워드의 상기 보정 계수를 상대적으로 큰 값으로 결정하는 단계를 포함하는 어플리케이션의 대표 키워드 결정 방법.
19. The method of claim 18, further comprising: determining the correction factor of each of the keywords of the target application based on the number of categories to which applications containing keywords overlapping each of the keywords of the target application among the plurality of applications belong. Lt; / RTI >
Determining the correction coefficient of the keyword of the target application to be a relatively small value when the number of categories to which the applications including the same keyword as the keyword of the target application belongs is relatively large among the plurality of applications; And
Determining the correction coefficient of the keyword of the target application to be a relatively large value when the number of categories to which the applications including the same keyword as the keyword of the target application belongs is relatively small among the plurality of applications, A method for determining representative keywords of an application to be included.
데이터베이스;
어플리케이션 마켓으로부터 복수의 어플리케이션들 각각의 설명 자료를 크롤링(crawling)하는 설명 자료 수집부;
상기 복수의 어플리케이션들 각각에 대하여, 상기 설명 자료에 포함되는 키워드들 및 상기 설명 자료에서 상기 키워드들의 비중들을 결정하여 상기 데이터베이스에 저장하는 키워드 추출부;
상기 복수의 어플리케이션들 중에서 목표 어플리케이션을 선택하고, 상기 복수의 어플리케이션들 중에서 상기 목표 어플리케이션과 높은 연관도를 갖는 연관 어플리케이션들의 목록을 획득하는 연관 어플리케이션 결정부; 및
상기 데이터베이스로부터 상기 목표 어플리케이션 및 상기 연관 어플리케이션들 각각의 상기 키워드들 및 상기 키워드들의 비중들을 독출하고, 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 연관 어플리케이션들의 상기 키워드들과 중복되는 키워드들을 중복 키워드들로 결정하고, 상기 목표 어플리케이션의 상기 키워드들의 비중들과 상기 연관 어플리케이션들 각각의 상기 중복 키워드들의 비중들에 기초하여 상기 목표 어플리케이션의 상기 키워드들 중에서 상기 목표 어플리케이션을 대표하는 대표 키워드들을 결정하는 키워드 분석부를 포함하는 어플리케이션의 대표 키워드 결정 시스템.
Database;
A description data collection unit for crawling description data of each of a plurality of applications from an application market;
A keyword extracting unit for each of the plurality of applications to determine the specific weight of the keywords from the keywords included in the explanatory data and the explanatory data and store the determined weight in the database;
An associated application determining unit selecting a target application among the plurality of applications and acquiring a list of related applications having a high degree of association with the target application among the plurality of applications; And
Reads out the weight of the keywords and the keywords of each of the target application and the related applications from the database and determines keywords that are overlapped with the keywords of the related applications among the keywords of the target application as duplicate keywords And a keyword analysis unit for determining representative keywords representing the target application among the keywords of the target application based on the weight of the keywords of the target application and the weight of the redundant keywords of each of the related applications A representative keyword determination system of an application to be executed.
KR1020180049073A 2018-04-27 2018-04-27 Method of determining representative keyword of application and system for determining representative keyword of application KR101871739B1 (en)

Priority Applications (2)

Application Number Priority Date Filing Date Title
KR1020180049073A KR101871739B1 (en) 2018-04-27 2018-04-27 Method of determining representative keyword of application and system for determining representative keyword of application
PCT/KR2018/008121 WO2019208872A1 (en) 2018-04-27 2018-07-18 Method and system for determining representative keyword of application

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020180049073A KR101871739B1 (en) 2018-04-27 2018-04-27 Method of determining representative keyword of application and system for determining representative keyword of application

Publications (1)

Publication Number Publication Date
KR101871739B1 true KR101871739B1 (en) 2018-06-27

Family

ID=62789824

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020180049073A KR101871739B1 (en) 2018-04-27 2018-04-27 Method of determining representative keyword of application and system for determining representative keyword of application

Country Status (2)

Country Link
KR (1) KR101871739B1 (en)
WO (1) WO2019208872A1 (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173818A (en) * 2011-02-17 2012-09-10 Ntt Docomo Inc Server and method for recommending application to user
KR20130122424A (en) * 2012-04-30 2013-11-07 삼성전자주식회사 Method and system for providing app service
KR20150090756A (en) * 2014-01-29 2015-08-06 한국외국어대학교 연구산학협력단 Method and apparatus for generating an opportunity map of mobile application
JP2017134787A (en) * 2016-01-29 2017-08-03 Kddi株式会社 Device, program, and method for analyzing topic evaluation in multiple areas

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7860895B1 (en) * 2005-08-23 2010-12-28 Amazon Technologies, Inc. Method and system for determining interest spaces among online content sources
US9483557B2 (en) * 2011-03-04 2016-11-01 Microsoft Technology Licensing Llc Keyword generation for media content
KR101828995B1 (en) * 2017-05-08 2018-02-14 한국과학기술정보연구원 Method and Apparatus for clustering keywords

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012173818A (en) * 2011-02-17 2012-09-10 Ntt Docomo Inc Server and method for recommending application to user
KR20130122424A (en) * 2012-04-30 2013-11-07 삼성전자주식회사 Method and system for providing app service
KR20150090756A (en) * 2014-01-29 2015-08-06 한국외국어대학교 연구산학협력단 Method and apparatus for generating an opportunity map of mobile application
JP2017134787A (en) * 2016-01-29 2017-08-03 Kddi株式会社 Device, program, and method for analyzing topic evaluation in multiple areas

Also Published As

Publication number Publication date
WO2019208872A1 (en) 2019-10-31

Similar Documents

Publication Publication Date Title
CN106599278B (en) Application search intention identification method and device
JP4920023B2 (en) Inter-object competition index calculation method and system
CN101814067B (en) System and methods for quantitative assessment of information in natural language contents
CN102902806B (en) A kind of method and system utilizing search engine to carry out query expansion
US8949227B2 (en) System and method for matching entities and synonym group organizer used therein
CN105095187A (en) Search intention identification method and device
CN101697109A (en) Method and system for acquiring candidates of input method
KR101491627B1 (en) Quantification method, apparatus and system of reviews for mobile application evaluation
CN111797214A (en) FAQ database-based problem screening method and device, computer equipment and medium
Geiß et al. Neckar: A named entity classifier for wikidata
CN109558587B (en) Method for classifying public opinion tendency recognition aiming at category distribution imbalance
JP2021022359A (en) Management system and management method
CN110362601A (en) Mapping method, device, equipment and the storage medium of metadata standard
CN101393550A (en) Method and system for calculating competitiveness betweens objects
CN101105799B (en) Method for evaluating file importance degree
JP2011248762A (en) Classification device, content retrieval system, content classification method, content retrieval method, and program
WO2023151576A1 (en) Search recommendation method, search recommendation system, computer device and storage medium
KR102063242B1 (en) Searching device and searching program
KR101871739B1 (en) Method of determining representative keyword of application and system for determining representative keyword of application
CN112035723A (en) Resource library determination method and device, storage medium and electronic device
Kuck et al. Context-sensitive service discovery meets information retrieval
CN114625973B (en) Anonymous information cross-domain recommendation method and device, electronic equipment and storage medium
KR20110138850A (en) User adaptive image management system and user adaptive image management method
KR101854912B1 (en) Method of analyzing correlation between applications and apparatus for analyzing correlation between applications
KR101871745B1 (en) Method of determining representative keyword of mobile device user and system for determining representative keyword of mobile device user

Legal Events

Date Code Title Description
E701 Decision to grant or registration of patent right
GRNT Written decision to grant