KR100902485B1 - Method for exctracting frequent access pattern of mobile user with time - Google Patents

Method for exctracting frequent access pattern of mobile user with time Download PDF

Info

Publication number
KR100902485B1
KR100902485B1 KR1020070089311A KR20070089311A KR100902485B1 KR 100902485 B1 KR100902485 B1 KR 100902485B1 KR 1020070089311 A KR1020070089311 A KR 1020070089311A KR 20070089311 A KR20070089311 A KR 20070089311A KR 100902485 B1 KR100902485 B1 KR 100902485B1
Authority
KR
South Korea
Prior art keywords
tree
location information
node
information
service information
Prior art date
Application number
KR1020070089311A
Other languages
Korean (ko)
Other versions
KR20090024347A (en
Inventor
김응모
이승철
옥지웅
Original Assignee
성균관대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 성균관대학교산학협력단 filed Critical 성균관대학교산학협력단
Priority to KR1020070089311A priority Critical patent/KR100902485B1/en
Publication of KR20090024347A publication Critical patent/KR20090024347A/en
Application granted granted Critical
Publication of KR100902485B1 publication Critical patent/KR100902485B1/en

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F2216/00Indexing scheme relating to additional aspects of information retrieval not explicitly covered by G06F16/00 and subgroups
    • G06F2216/03Data mining

Landscapes

  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

본 발명은 모바일 유저의 시간대별 행동패턴을 트리 구조로 변환한 후 빈발한 트리 패스를 추출하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법으로서, 하루를 일정 시간 단위로 구분한 타임 스탬프를 정의하는 제 1 단계, 타임 스탬프에서 정의된 시간대별로 각 모바일 유저의 위치정보 및 서비스 정보를 통합하여, 모바일 유저의 유저 ID, 타임 스탬프, 그리고 위치정보 및 위치정보에 따른 서비스 정보로 구성되는 각 모바일 유저에 대한 시간대별 행동패턴을 포함하는 통합 로그 데이터를 생성하고 통합 데이터베이스에 저장하는 제 2 단계, 통합 데이터베이스를 스캔하여, 통합 로그 데이터의 행동패턴 중 임계치 이상의 지지도를 갖는 위치정보를 추출하여 헤더 테이블을 생성하는 제 3 단계, 헤더 테이블을 기반으로 하여, 통합 로그 데이터의 행동패턴에 포함된 위치정보 패턴에 대한 위치정보 트리를 구성하는 제 4 단계, 각 위치정보 패턴에 따른 서비스 정보 패턴에 대한 서비스 정보 트리를 구성하는 제 5 단계, 그리고 제 4 단계 및 제 5 단계에서 생성된 위치정보 트리 및 서비스 정보 트리 중 빈발한 트리 패스를 추출하는 제 6 단계를 포함하는 것을 특징으로 한다.The present invention is a method of extracting a frequent behavior pattern of a mobile user according to a time for converting a behavior pattern of a mobile user's time zone into a tree structure and extracting a frequent tree path, and defining a time stamp in which a day is divided by a unit of time. In the first step, the location information and service information of each mobile user are integrated for each time zone defined in the time stamp, and each mobile user includes a user ID, a time stamp, and service information according to the location information and location information. The second step of generating integrated log data including time-phased behavioral patterns for and storing them in the integrated database, scans the integrated database, extracts the location information having support above the threshold value among the behavioral patterns of the integrated log data, and extracts the header table. Third step to generate, based on the header table, consolidated log data A fourth step of constructing a location information tree for the location information pattern included in the behavior pattern of the fifth step of constructing a service information tree for the service information pattern according to each location information pattern, and a fourth step and a fifth step And extracting a frequent tree path from the location information tree and the service information tree generated by the method.

데이터 마이닝; 유비쿼터스; 행동패턴 Data mining; Ubiquitous; Behavior pattern

Description

시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법{METHOD FOR EXCTRACTING FREQUENT ACCESS PATTERN OF MOBILE USER WITH TIME}How to extract frequent behavior patterns of mobile users over time {METHOD FOR EXCTRACTING FREQUENT ACCESS PATTERN OF MOBILE USER WITH TIME}

본 발명은 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법에 관한 것으로서, 구체적으로 모바일 유저의 행동패턴을 모바일 에이전트 간의 통신인 반구조적인 데이터 형식에 용이한 트리 구조로 변환한 후 빈발한 트리 패스를 추출함으로써 시간대별로 모바일 유저의 빈발한 행동패턴, 즉 유용한 행동패턴을 추출하는 방법에 관한 것이다.The present invention relates to a method of extracting frequent behavior patterns of a mobile user over time, and more particularly, after converting a behavior pattern of a mobile user into an easy tree structure for a semi-structured data format that is a communication between mobile agents. The present invention relates to a method of extracting frequent behavior patterns of mobile users, that is, useful behavior patterns, by time zone.

유비쿼터스 컴퓨팅은 일상생활 속에 편재해 있는 PDA 또는 모바일 폰 등의 무선 단말기를 이용하여 사용자가 언제, 어디서나 유용한 서비스를 받을 수 있는 환경을 제공한다. 또한 유비쿼터스 환경에서 지능형 멀티 모바일 에이전트간의 통신을 통해 반구조적인 데이터, 즉 계층적인 데이터 구조를 가지는 상황인식데이터를 이용하여 사용자의 위치에 따른 서비스된 행동패턴을 추출할 수 있게 되었다.Ubiquitous computing provides an environment where users can receive useful services anytime, anywhere using wireless terminals such as PDAs or mobile phones that are ubiquitous in everyday life. In addition, in the ubiquitous environment, it is possible to extract service behavior patterns according to the user's location by using semi-structured data, that is, situational recognition data with hierarchical data structure, through intelligent multi-mobile agent communication.

그러나, 종래의 위치정보와 서비스 정보만을 이용한 사용자 행동패턴 추출 방법의 경우, 단순히 통계적인 사용자의 빈발 행동패턴만을 추출하였다. 따라서, 사용자의 동적인 변화, 즉 시간에 따른 사용자의 서비스 요청에 능동적으로 대처할 수 없는 문제점이 있었다.However, in the conventional method of extracting user behavior patterns using only location information and service information, only the frequent behavior patterns of statistical users are extracted. Accordingly, there is a problem in that the user cannot actively cope with the dynamic change of the user, that is, the service request of the user over time.

언제, 어디서나 컴퓨터 또는 네트워크의 여건에 구애받지 않고 자유롭게 네트워크에 접속할 수 있는 정보기술(IT)이 가능해지는 유비쿼터스 환경의 가시화와, 사용자를 가급적 컴퓨팅의 직접적인 운영으로부터 해방시키는 지능형 환경의 결합으로 인해 종래와 같이 단순한 통계적 분석에 의한 정보와 지식 추출 및 접근은 그 한계성을 갖게 되었다. 따라서, 지능형 유비쿼터스 환경에서의 효율적이면서 반구조적 데이터의 시간적 정보 추출이 가능한 마이닝 기법을 통해 지능형 유비쿼터스 환경에 부합하는 실시간적인 사용자 중심의 서비스와 함께 여러 가지 응용 시스템이 절실히 요구되고 있다.With the combination of the visualization of the ubiquitous environment that enables information technology (IT) to be freely connected to the network anytime, anywhere, regardless of computer or network conditions, and the intelligent environment that frees users from the direct operation of computing as much as possible, Likewise, the extraction and access of information and knowledge by simple statistical analysis has become limited. Therefore, through the mining technique that can extract the temporal information of the efficient and semi-structured data in the intelligent ubiquitous environment, various application systems are urgently required along with the real-time user-oriented services that meet the intelligent ubiquitous environment.

본 발명은 상기와 같은 종래의 문제점을 해결하기 위하여 제안된 것으로서, 본 발명의 목적은 사용자의 동적인 변화, 즉 시간에 따른 사용자의 서비스 요청에 능동적으로 대처할 수 있는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법을 제공하는 것이다.The present invention has been proposed in order to solve the above-mentioned conventional problems, and an object of the present invention is the frequent change of the mobile user over time, which can actively cope with the dynamic change of the user, that is, the service request of the user over time. It is to provide a method of extracting behavior patterns.

상기의 목적을 달성하기 위하여, 본 발명에 따른 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법은, 모바일 유저의 시간대별 행동패턴을 트리 구조로 변환한 후 빈발한 트리 패스를 추출하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법으로서, 하루를 일정 시간 단위로 구분한 타임 스탬프를 정의하는 제 1 단계, 타임 스탬프에서 정의된 시간대별로 각 모바일 유저의 위치정보 및 서비스 정 보를 통합하여, 모바일 유저의 유저 ID, 타임 스탬프, 그리고 위치정보 및 위치정보에 따른 서비스 정보로 구성되는 각 모바일 유저에 대한 시간대별 행동패턴을 포함하는 통합 로그 데이터를 생성하고 통합 데이터베이스에 저장하는 제 2 단계, 통합 데이터베이스를 스캔하여, 통합 로그 데이터의 행동패턴 중 임계치 이상의 지지도를 갖는 위치정보를 추출하여 헤더 테이블을 생성하는 제 3 단계, 헤더 테이블을 기반으로 하여, 통합 로그 데이터의 행동패턴에 포함된 위치정보 패턴에 대한 위치정보 트리를 구성하는 제 4 단계, 각 위치정보 패턴에 따른 서비스 정보 패턴에 대한 서비스 정보 트리를 구성하는 제 5 단계, 그리고 제 4 단계 및 제 5 단계에서 생성된 위치정보 트리 및 서비스 정보 트리 중 빈발한 트리 패스를 추출하는 제 6 단계를 포함하는 것을 특징으로 한다.In order to achieve the above object, the frequent behavior pattern extraction method of the mobile user according to the time according to the present invention, after converting the behavior pattern for each time zone of the mobile user into a tree structure according to the time to extract the frequent tree path A method of extracting a frequent behavior pattern of a mobile user, the first step of defining a time stamp that divides a day into a certain unit of time, by integrating the location information and service information of each mobile user for each time zone defined in the time stamp, A second step of generating integrated log data including a user ID, a time stamp, and a time-phase behavior pattern for each mobile user including location information and service information according to the location information, and storing the data in an integrated database; Scanning and positioning with support above the threshold among the behavior patterns of the consolidated log data A third step of generating a header table by extracting the data stream, a fourth step of constructing a location information tree for the location information pattern included in the behavior pattern of the integrated log data based on the header table, and a service according to each location information pattern And a sixth step of constructing a service information tree for the information pattern, and a sixth step of extracting a frequent tree path among the location information tree and the service information tree generated in the fourth and fifth steps. .

바람직하게는, 제 3 단계가, 통합 데이터베이스를 스캔하여 통합 로그 데이터의 행동패턴에 포함된 각 위치정보를 순서에 무관하게 카운트하는 제 3-1 단계, 그리고 카운트된 정보가 임계치 보다 작은 위치정보를 제거하는 제 3-2 단계를 포함하도록 한다. 또한, 제 4 단계는, 루트에 널(Null) 값을 부여하는 제 4-1 단계, 그리고 통합 로그 데이터의 각 유저 ID에 대하여 각 타임 스탬프의 행동패턴에 포함된 시퀀스한 위치정보를 각기 노드로 생성하고 서로 연결하는 제 4-2 단계를 포함하고, 각 노드가, 위치정보 및 각 노드까지의 트리 패스에 대응하는 위치정보 패턴이 발생한 카운트를 포함하도록 한다. 이때, 제 4-2 단계에서, 통합 로그 데이터의 특정 행동패턴에 포함된 위치정보가, 위치정보 트리의 노드에 이미 생성된 경우 새로운 노드를 생성하는 대신 기존 노드의 카운트를 올려주도록 한다. 또한, 제 5 단계는, 루트에 널(Null) 값을 부여하는 제 5-1 단계, 통합 로그 데이터의 행동패턴에 포함된 각 서비스 정보 중, 위치정보 트리의 각 트리 패스에 포함된 위치정보 패턴에 대한 서비스 정보로 노드를 구성하고 서로 연결하는 제 5-2 단계, 각 서비스 정보 트리의 루트를 대응하는 위치정보 트리의 트리 패스의 테일 노드에 연결하는 제 5-3 단계, 그리고 각 노드의 레벨 및 타임 스탬프를 포함하는 서비스 정보 트리 헤더 테이블의 각 타임 스탬프와 각 노드를 연결하는 제 5-4 단계를 포함하고, 서비스 트리의 각 노드가, 서비스 정보 및 각 노드까지의 트리 패스에 대응하는 서비스 정보 패턴이 발생한 카운트를 포함하도록 한다. 더욱 바람직하게는, 제 6 단계가, 위치정보 트리에 대하여, 트리 패스의 각 노드의 카운트가 미리 설정된 빈발도 보다 작은 경우, 해당 트리 패스 및 연결된 서비스 트리를 가지치기하는 제 6-1 단계, 그리고 서비스 정보 트리에 대하여, 트리 패스의 각 노드의 카운트가 빈발도 보다 작은 경우, 해당 트리 패스를 가지치기하는 제 6-2 단계를 포함하도록 한다.Preferably, the third step is a step 3-1 of scanning the unified database and counting each location information included in the behavior pattern of the unified log data irrespective of the order, and the location information having the counted information smaller than the threshold value. Include step 3-2 of removing. Further, the fourth step includes steps 4-1 for giving a null value to the root, and sequenced position information included in the behavior pattern of each time stamp for each user ID of the integrated log data to each node. And a fourth step of generating and connecting to each other, wherein each node includes a location information and a count of generating location information patterns corresponding to a tree path to each node. In this case, in step 4-2, when the location information included in the specific behavior pattern of the integrated log data is already generated in the node of the location information tree, the count of the existing node is increased instead of creating a new node. In addition, the fifth step is the fifth step of giving a null value to the root, the location information pattern included in each tree path of the location information tree of the service information included in the behavior pattern of the integrated log data Step 5-2 of configuring nodes with service information for and connecting them to each other, step 5-3 of connecting a root of each service information tree to a tail node of a tree path of a corresponding location information tree, and the level of each node And a fifth step of connecting each time stamp and each node of the service information tree header table including a time stamp, wherein each node of the service tree corresponds to a service path and a tree path to each node. Include counts in which information patterns have occurred. More preferably, the sixth step is a sixth step of pruning the tree path and the connected service tree when the count of each node of the tree path is less than the preset frequency with respect to the location information tree, and For the service information tree, if the count of each node of the tree path is less than the frequent frequency, step 6-2 of pruning the tree path is included.

이상 설명한 바대로, 본 발명에 따른 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법은 마이닝 기법을 이용하여 지능형 유비쿼터스 환경에서 반구조적 데이터로부터 모바일 사용자의 시간에 따른 유용한 행동패턴 정보를 추출할 수 있으며, 이를 통해 다양한 사용자 중심의 서비스는 물론 여러 가지 응용 시스템의 기반을 제공할 수 있는 현저한 효과가 있다.As described above, the frequent behavior pattern extraction method of the mobile user over time according to the present invention can extract useful behavior pattern information over time of the mobile user from the semi-structured data in an intelligent ubiquitous environment using a mining technique. This has the remarkable effect of providing the foundation of various application systems as well as various user-oriented services.

본 발명은 지능형 유비쿼터스 환경에서 모바일 에이전트 간의 통신인 반구조적 데이터로 이루어진 상황인식데이터를 이용하여 모바일 유저의 유용한 행동패턴을 추출한다. 구체적으로, 전처리 과정에서 사용자 및 관리자에 의해 타임 스탬프를 미리 정의한 후 반구조적 데이터로 되어 있는 상황인식데이터와 결합시킨다. 즉, 타임 스탬프를 미리 정의한 후 타임 스탬프에 맞게 모바일 사용자의 위치정보 및 서비스 정보를 통합하여 통합 로그 데이터를 생성한다. 통합된 로그 데이터는 통합 데이터베이스에 저장된다. 이처럼 통합된 데이터베이스는 튜플 기반으로서, 메모리 적재 및 모바일 서비스의 신속한 접근에 있어 제한적이므로, 트리구조로 변형한 후 사용자 및 관리자가 정한 시간대별 사용자의 위치정보 및 서비스된 정보를 추출하여야 한다. 이를 통해, 개별적 데이터 관리가 가능해져 접근 제한성 및 속도의 저하를 막을 수 있을 뿐만 아니라 더욱 콤팩트하고 메모리 적재에 용이한 트리구조로 용이하게 변환할 수 있다. 또한, 트리 구조로 사용자의 위치정보 및 서비스 정보를 표현함으로써 보다 효율적으로 모바일 사용자의 행동패턴을 추출할 수 있다. 뿐만 아니라, 시간대별 사용자의 빈발한 패턴을 발견함으로써 광고 기획사 및 국가 공익 광고 등에서 시간대별로 각각의 모바일 사용자에게 알맞은 정보를 제공할 수 있으며, 유비쿼터스 환경에서 모바일 사용자에게 적절한 실시간 서비스를 제공할 수 있다.The present invention extracts useful behavior patterns of mobile users using contextual awareness data consisting of semi-structured data that is communication between mobile agents in an intelligent ubiquitous environment. Specifically, the time stamp is pre-defined by the user and the administrator in the preprocessing process and then combined with the situation recognition data which is composed of semi-structured data. That is, after defining the time stamp in advance, the integrated log data is generated by integrating the location information and service information of the mobile user according to the time stamp. Consolidated log data is stored in the consolidated database. The integrated database is a tuple-based, limited in memory loading and quick access to mobile services. Therefore, after transforming into a tree structure, the user's location information and service information for each time zone determined by the user and the administrator must be extracted. This enables individual data management, preventing access restrictions and speed degradation, as well as easily converting into a more compact and easy-to-load tree structure. Also, by representing the location information and the service information of the user in a tree structure, the behavior pattern of the mobile user can be extracted more efficiently. In addition, by discovering frequent patterns of users by time zones, the advertisement planner and national public service advertisements can provide appropriate information for each mobile user at each time zone, and can provide appropriate real-time services to mobile users in a ubiquitous environment.

이하에서는, 첨부한 도면을 참조하여 본 발명의 장점, 특징 및 바람직한 실시예에 대하여 상세히 설명하도록 한다.Hereinafter, with reference to the accompanying drawings will be described in detail the advantages, features and preferred embodiments of the present invention.

도 1은 지능형 미들웨어 플렛폼과 마이닝 모듈이 통합된 시스템 구성을 도시한 도로서, 마이닝 모듈이 미들웨어에 연동되는 상태를 도시한 도이다. 도 1의 시스템에서는 미들웨어 플랫폼으로 CALM 플랫폼을 사용하였다. 도 1에 도시한 바와 같이, 유비쿼터스 컴퓨팅 환경에서 미들웨어 플랫폼의 지능형 모바일 에이전트에 마이닝 모듈을 통합함으로써 축적된 데이터에서 사용자의 요구사항 및 유용한 정보를 효과적으로 마이닝할 수 있으며, 특히 더욱 빠르고 정확하게 사용자의 시간대별 행동패턴을 추출할 수 있다. 구체적으로, 지능형 모바일 에이전트는 각 센서를 통하여 모바일 단말기의 정보를 축적하고 축적된 정보를 마이닝 모듈을 이용하여 효과적으로 마이닝한 후 의사결정 시스템과 연동하여 사용자의 의사결정에 도움을 줄 수 있다.FIG. 1 is a diagram illustrating a system configuration in which an intelligent middleware platform and a mining module are integrated, and illustrates a state in which a mining module is linked to middleware. In the system of FIG. 1, the CALM platform was used as the middleware platform. As shown in FIG. 1, by integrating a mining module into an intelligent mobile agent of a middleware platform in a ubiquitous computing environment, the user's requirements and useful information can be effectively mined from the accumulated data. Behavior patterns can be extracted. In detail, the intelligent mobile agent accumulates the information of the mobile terminal through each sensor and effectively mines the accumulated information by using the mining module, and then may be linked with the decision system to assist the user in making a decision.

도 2는 본 발명에 따른 시간에 따른 모바일 유저의 빈발한 행동패턴을 추출하기 위한 시스템 구성도로서, 도 1에서 마이닝 모듈의 상세한 시스템 구성을 도시한 도이다. 도 2에 도시한 바와 같이, 미들웨어의 지능형 모바일 에이전트는 모바일 단말기 사용자의 시간대별 로그 정보(Temporal Log Information)를 사용자의 시간대별 위치정보(Movement Log Information) 및 요청된 서비스 정보(Service Requested Log Information)로 분류하여 축적한다. 축적된 위치정보 및 서비스 정보는 시간대별로 통합된 후 통합 데이터베이스(Integrated Database)에 저장된다. 통합 데이터베이스에 저장된 시간대별 위치정보 및 서비스 정보의 로그 데이터(통 합 로그 데이터)는 본 발명에 따른 마이닝 알고리즘에 의해 사용자의 요구사항 및 원하는 정보를 추출하는데 사용된다.2 is a system configuration diagram for extracting a frequent behavior pattern of a mobile user over time according to the present invention, which shows a detailed system configuration of a mining module in FIG. As shown in FIG. 2, the intelligent mobile agent of the middleware stores time log information of a mobile terminal user in a time zone location information of the mobile terminal and service requested log information. Accumulate by classifying. Accumulated location information and service information are integrated in each time zone and then stored in an integrated database. The log data (integrated log data) of the time zone location information and the service information stored in the integrated database is used to extract user requirements and desired information by the mining algorithm according to the present invention.

한편, 본 발명에서 시간에 따른 모바일 유저의 유용한 행동패턴을 추출하기 위하여 사용되는 문제 정의는 이하의 수학식 1과 같다.On the other hand, the problem definition used to extract the useful behavior pattern of the mobile user over time in the present invention is the following equation (1).

Figure 112007064196580-pat00001
Figure 112007064196580-pat00001

Figure 112007064196580-pat00002
Figure 112007064196580-pat00002

수학식 1에서 l은 위치정보, s는 서비스 정보를 나타내는 값으로, (l:s)t에서 l:s는 위치정보(l)와 서비스 정보(s)의 동등한 시간대(t)의 정보 집합을 나타낸다. 따라서, 수학식 1을 통해 위치정보와 서비스 정보를 이용하여 시간대별 모바일 유저의 행동패턴을 추출하고, 각 시간대별로 사용자의 유용한 빈발 행동패턴을 추출할 수 있게 된다.In Equation 1, l denotes location information and s denotes service information, and (l: s) t to l: s denote an information set of an equal time zone (t) of location information (l) and service information (s). Indicates. Therefore, through the equation (1) it is possible to extract the behavior pattern of the mobile user for each time zone using the location information and service information, and to extract the useful frequent behavior pattern of the user for each time zone.

사용자의 유용한 행동패턴, 즉 사용자의 빈발한 행동패턴을 위한 지지도는 수학식 2와 같이 표현할 수 있다.The user's useful behavior pattern, that is, the support for the user's frequent behavior pattern may be expressed as Equation 2.

Figure 112007064196580-pat00003
Figure 112007064196580-pat00003

전체 통합 데이터베이스(Integrated Database)의 통합 로그 데이터에서 시간대별로 나타나는 위치에 따른 서비스 정보를 추출하여 사용자 또는 관리자가 미리 설정한 임계치 이상일 경우 빈발하다고 판단한다.Service information is extracted from the integrated log data of the entire integrated database in each time zone, and it is determined to be frequent when the user or administrator exceeds a predetermined threshold.

도 3은 본 발명에 따른 시간에 따른 모바일 유저의 빈발한 행동패턴을 추출하는 과정의 흐름도이다. 도 3을 참조하여 본 발명에 따른 시간에 따른 모바일 유저의 빈발한 행동패턴을 추출하는 과정을 설명하면 이하와 같다.3 is a flowchart of a process of extracting a frequent behavior pattern of a mobile user over time according to the present invention. Referring to Figure 3 describes the process of extracting the frequent behavior pattern of the mobile user over time according to the present invention.

먼저, 시간에 따른 모바일 유저의 행동패턴을 추출하기 위한 마이닝 과정을 수행하기 전에 전처리 과정으로 타임 스탬프를 정의한다(ST100). 타임 스탬프는 원하는 시간대별로 원하는 정보를 추출하기 위한 것으로, 하루를 일정 시간 단위로 구분하여 정의할 수 있다.First, before performing a mining process for extracting a behavior pattern of a mobile user over time, a time stamp is defined as a preprocessing process (ST100). The time stamp is for extracting desired information for each desired time zone and may be defined by dividing the day into a predetermined time unit.

타임 스탬프가 정의되면, 정의된 시간대별로 위치정보 및 서비스 정보를 통합하여 하나의 통합된 로그 데이터를 생성한다(ST110). 이때, 통합 로그 데이터는 유저 ID, 타임 스탬프 및 행동패턴으로 구성되며, 행동패턴은 다시 위치정보와 그에 따른 서비스 정보로 구성된다. 서비스 정보는 관리자 또는 사용자에 의해 미리 설정된 값을 부여하며, 시퀀스한 정보를 갖는다. 통합 로그 데이터는 통합 데이터베이스에 저장된다. 이후, 통합 데이터베이스에 저장된 통합 로그 데이터를 콤팩트한 트리 구조로 변환하는 과정이 수행된다.When the time stamp is defined, one integrated log data is generated by integrating location information and service information for each defined time zone (ST110). At this time, the integrated log data is composed of a user ID, a time stamp and a behavior pattern, and the behavior pattern is composed of location information and service information accordingly. The service information gives a value preset by an administrator or a user, and has sequenced information. Integrated log data is stored in the integrated database. Thereafter, a process of converting the integrated log data stored in the integrated database into a compact tree structure is performed.

통합 로그 데이터를 트리 구조로 변환하기 위하여, 우선 통합 로그 데이터의 각 행동패턴으로부터 헤더 테이블을 추출한다(ST120). 헤더 테이블은 통합 로그 데이터의 행동패턴 중 임계치 이상의 지지도를 갖는 위치정보를 추출함으로써 생성된다. 구체적으로, 통합 데이터베이스를 스캔하여 통합 로그 데이터의 행동패턴에 포함된 각 위치정보를 카운트한 후, 임계치 이상의 카운트를 갖는 위치정보만을 추출한다. 임계치보다 작은 카운트를 갖는 위치정보는 빈발하지 않은 위치정보이며, 빈발하지 않은 위치정보에서는 서비스 정보 역시 빈발하지 않으므로 제거된다. 이때, 임계치는 관리자 또는 사용자에 의해 미리 설정된다.In order to convert the integrated log data into a tree structure, first, a header table is extracted from each behavior pattern of the integrated log data (ST120). The header table is generated by extracting location information having a support level greater than or equal to a threshold value among behavior patterns of the integrated log data. Specifically, after scanning the unified database to count each location information included in the behavior pattern of the unified log data, only the location information having a count equal to or greater than the threshold value is extracted. The location information having a count less than the threshold is non-frequent location information, and in the non-frequent location information, the service information is also rare and thus removed. At this time, the threshold is preset by an administrator or a user.

ST120에서 헤더 테이블이 생성되면, 이를 기반으로 하여 위치정보에 대한 트리를 구성한다(ST130). 위치정보에 대한 트리는 루트에 널(Null) 값을 부여한 후, 각 유저 ID의 타임 스탬프별로 행동패턴에 포함된 위치정보를 각기 노드로 표시 및 연결함으로써 생성된다. 즉, 각 유저 ID의 타임 스탬프별 행동패턴의 위치정보는 서로 시퀀스하므로 이들 위치정보를 각기 노드로 구성하여 루트에 연결함으로써 위치정보에 대한 트리를 구성할 수 있다. 이때, 각 노드에는 위치정보와 함께 해당 위치정보의 패턴이 발생한 카운트를 표시한다. 또한, 특정 행동패턴에 포함된 위치정보들이 이미 위치정보 트리에 노드로 생성되어 있는 경우, 새로이 노드를 생성하지 않고 카운트만을 올려준다. 이때, 임계치보다 작은 지지도를 가짐으로 인해 헤더 테이블에 포함되지 않은 위치정보는 트리에 표현되지 않음은 물론이다. 즉, 위치정보에 대한 트리는 헤더 테이블에 포함된 위치정보만으로 구성된다.When the header table is generated in ST120, a tree for the location information is constructed based on this (ST130). The tree for the location information is created by assigning a null value to the root, and then displaying and connecting the location information included in the behavior pattern to each node by time stamp of each user ID. That is, since the location information of the behavior pattern for each user ID of each user ID is sequenced with each other, the tree for the location information can be constructed by configuring these location information as nodes and connecting them to the root. At this time, each node displays a count of occurrence of a pattern of the corresponding location information together with the location information. In addition, when the location information included in the specific behavior pattern is already generated as a node in the location information tree, only the count is raised without creating a new node. At this time, location information not included in the header table is not represented in the tree due to having a support degree smaller than the threshold. That is, the tree for the location information consists only of the location information included in the header table.

위치정보에 대한 트리가 완성되면, 서비스 정보에 대한 트리를 구성한 다(ST140). 서비스 정보에 대한 트리 역시, 루트에 널(Null) 값을 부여한 후, 통합 로그 데이터의 행동패턴에 포함된 서비스 정보들로 노드를 구성 및 연결함으로써 생성된다. 구체적으로, 위치정보 트리의 각 위치정보의 패턴에 대한 서비스 정보를 각기 노드로 구성 및 연결한다. 이때, 서비스 정보 트리의 각 노드 역시 서비스 정보와 함께 해당 서비스 정보 패턴이 발생한 카운트를 표시하도록 한다. 서비스 정보 트리가 생성되면, 각 서비스 정보 트리의 루트를 해당 위치정보 트리의 테일 노드에 연결한다. 즉, 각 서비스 정보 트리의 서비스 정보 패턴에 대한 위치정보 패턴의 트리의 테일 노드에 서비스 정보 트리의 루트를 연결한다.When the tree for the location information is completed, a tree for the service information is constructed (ST140). The tree for the service information is also created by assigning a null value to the root, and then constructing and connecting nodes with the service information included in the behavior pattern of the integrated log data. Specifically, the service information for each pattern of location information of the location information tree is configured and connected to each node. At this time, each node of the service information tree also displays the count of occurrence of the corresponding service information pattern together with the service information. When the service information tree is generated, the root of each service information tree is connected to the tail node of the corresponding location information tree. That is, the root of the service information tree is connected to the tail node of the tree of the location information pattern for the service information pattern of each service information tree.

위치정보 트리 및 서비스 정보 트리가 완성되면, 생성된 트리 중 빈발한 패스를 추출한다(ST150). 이때, 빈발한 패스를 추출하는 기준은 관리자 또는 사용자에 의해 미리 설정된 빈발도를 이용하도록 하며, 헤더 테이블 생성에 사용된 임계치와 동일한 값을 사용할 수 있다. 우선, 위치정보 트리 및 서비스 정보 트리에서, 위치정보 패턴에 포함된 각 위치정보의 빈발한 정도, 즉 위치정보 트리 패스의 각 노드의 카운트가 상기 빈발도 보다 작은 트리 패스를 가지치기하여 제거한다. 이때, 위치정보의 트리 패스가 가지치기 되면 해당 서비스 정보 트리 역시 가지치기 됨은 물론이다. 다음으로, 서비스 정보 트리의 각 서비스 정보 패턴에 포함된 각 서비스 정보의 빈발한 정도, 즉 서비스 정보 트리 패스의 각 노드의 카운트가 빈발도 보다 작은 트리 패스를 가지치기한다. 이와 같이 빈발하지 않은 트리 패스를 가지치기한 후에는 최소 지지도 이상의 빈발한 트리 패스만이 남게 된다. 따라서, 빈발한 트리 패스를 통해 모바일 유저의 시간대별(타임 스탬프별)로 빈발한, 즉 유용한 행동패턴을 모두 추출할 수 있게 된다.When the location information tree and the service information tree are completed, frequent paths are extracted from the generated tree (ST150). In this case, a criterion for extracting a frequent path may be to use a frequent degree preset by an administrator or a user, and may use a value equal to a threshold used for generating a header table. First, in the location information tree and the service information tree, the degree of frequent occurrence of each location information included in the location information pattern, that is, the count of each node of the location information tree path is removed by pruning the tree path whose frequency is smaller than the frequency. At this time, if the tree path of the location information is pruned, the corresponding service information tree is also pruned. Next, the tree paths whose frequency of each service information included in each service information pattern of the service information tree, i.e., the count of each node of the service information tree path is less than the frequent frequency, are pruned. After pruning the infrequent tree paths, only the frequent tree paths with minimum support are left. Therefore, through the frequent tree path, it is possible to extract all the frequent, useful behavior patterns, by time zone (by time stamp) of the mobile user.

이하에서는, 모바일 유저의 시간대별 유용한 행동패턴을 추출하는 과정을 예를 들어 더욱 상세하게 설명하도록 한다.Hereinafter, a process of extracting a useful behavior pattern for each time zone of a mobile user will be described in more detail, for example.

도 4는 본 발명에 따른 타임 스탬프의 예시도이다. 도 4에 도시한 타임 스탬프는 마이닝 과정의 전처리 단계에서 관리자 또는 사용자가 미리 설정하여 생성되며, 타임 스탬프를 이용하여 원하는 시간대별로 원하는 정보를 추출할 수 있다. 도 4에서는 임의로 하루를 4시간씩 타임 스탬프 간격을 유지하여 T1부터 T6으로 정의하였다. 이를 통해 4시간 간격으로 모바일 유저의 위치에 따른 서비스 정보를 추출할 수 있다.4 is an exemplary view of a time stamp according to the present invention. The time stamp shown in FIG. 4 is generated by a manager or a user in advance in a preprocessing step of a mining process, and may extract desired information for each desired time period using the time stamp. In FIG. 4, one day is defined as T1 to T6 by maintaining a time stamp interval of 4 hours each day. Through this, service information according to the location of the mobile user can be extracted at intervals of 4 hours.

도 5는 본 발명에 따른 통합 로그 데이터의 예시도로서, 전처리 과정에서 정의된 타임 스탬프에서 정의된 시간대별로 각각의 모바일 유저의 위치정보와 요청된 서비스 정보를 통합하여 하나의 통합된 로그 데이터를 생성한 예를 도시한 도이다. 도 5에 도시한 바와 같이, 통합된 로그 데이터는 유저 ID, 타임 스탬프 및 행동패턴으로 구성되며, 이 중 타임 스탬프는 전처리 과정에서 미리 정의된 타임 스탬프(도 4)를 사용하고, 행동 패턴은 위치정보에 따른 요청된 서비스 정보를 포함하도록 한다. 구체적으로, 도 5에서, 유저 ID 100번의 T1이라는 시간대에 <A:1 B:2 C:5 D:8> 정보가 축적되어 있는데, 여기서 A는 위치정보(수학식 1의 l)를 나타내고 숫자 1은 서비스 정보(수학식 1의 s)를 나타낸다. 서비스 정보는 관리자 또는 사용자가 사전에 임의로 설정한 값으로, 예를 들어 1번은 미용실, 2번은 슈퍼마켓과 같이 설정할 수 있다. 이때, 각각의 위치정보에 따른 요청된 서비스 정보는 시퀀스한 정보를 가지며, 이는 모바일 유저가 한 번에 다른 일을 처리할 수 없는 점에 착안하여 각각의 행동 패턴은 유니크하지는 않지만 동일 시간대에는 유니크한 순서를 갖는다. 이와 같이, 전처리 과정에서 정의된 타임 스탬프를 이용하여 정의된 시간대별 위치정보와 요청된 서비스 정보를 통합하여 하나의 통합된 로그 데이터를 생성할 수 있으며, 이와 같이 하나의 통합된 로그 데이터를 통합 데이터베이스에 저장함으로써 정보의 개별화로 인한 빠른 접근성의 한계와 검색 시간의 지연과 같은 문제점을 해결할 수 있다.5 illustrates an example of integrated log data according to the present invention, in which a single log data is generated by integrating location information of each mobile user and requested service information for each time zone defined in a time stamp defined in a preprocessing process. Fig. 1 shows an example. As shown in FIG. 5, the integrated log data is composed of a user ID, a time stamp, and a behavior pattern, of which a time stamp uses a predefined time stamp (FIG. 4) in a preprocessing process, and the behavior pattern is located. Include the requested service information according to the information. Specifically, in FIG. 5, <A: 1 B: 2 C: 5 D: 8> information is accumulated in the time zone T1 of the user ID 100, where A represents positional information (l in Equation 1) and a number. 1 represents service information (s in Equation 1). The service information is a value set in advance by an administrator or a user, for example, number 1 may be set as a beauty salon and number 2 as a supermarket. At this time, the requested service information according to each location information has sequenced information, which is focused on the fact that the mobile user cannot handle other tasks at once, so that each behavior pattern is not unique but unique at the same time. Has an order. As such, by using the time stamp defined in the preprocessing process, the defined time zone location information and the requested service information may be integrated to generate one consolidated log data. The problem can be solved by limiting the speed of retrieval and the limitation of fast access due to the individualization of information.

도 5와 같이 통합 데이터베이스에 축적된 통합 로그 데이터는 튜플 기반으로 이루어져 있으며, 각 사용자에 대한 정보를 통합하여 저장하고 있다. 그러나, 튜플 기반의 데이터 구조는 유비쿼터스 컴퓨팅 환경에서 보다 빠르고 정확하며 메모리에 적재하기 쉬운 구조에 대한 필요성을 충족시킬 수 없다. 따라서, 본 발명에서는 튜플 기반의 데이터 구조를 콤팩트하고 메모리 적재에 용이한 트리 구조로 변경한 후 모바일 유저의 유용한 행동패턴, 즉 빈발한 행동패턴을 추출하도록 한다. 이하에서는, 도 5의 로그 데이터를 이용하여 위치정보 및 서비스 정보의 트리를 구성하는 과정을 설명하도록 한다.As shown in FIG. 5, the integrated log data accumulated in the integrated database is based on a tuple, and is integrated and stored for each user. However, tuple-based data structures cannot meet the need for faster, more accurate and easier to load structures in ubiquitous computing environments. Therefore, in the present invention, the tuple-based data structure is changed to a compact and easy-to-load tree structure to extract useful behavior patterns, that is, frequent behavior patterns of mobile users. Hereinafter, a process of constructing a tree of location information and service information using the log data of FIG. 5 will be described.

도 6은 본 발명에 따른 헤더 테이블의 예시도로서, 도 5와 같이 통합 데이터베이스에 축적된 정보를 바탕으로 최소 지지도(Min_Sup) 이상을 만족하는 위치정보를 추출하는 과정을 도시한 도이다. 먼저, 도 6(a)에 도시한 바와 같이, 도 6에서 발생하는 각 위치정보를 시간에 상관없이 추출 및 카운트한 정보를 생성하고, 각 위치정보 중 지지도, 즉 카운트가 미리 설정된 임계치 이상인 위치정보만을 추출하여 도 6(b)와 같은 헤더 테이블을 생성한다. 도 6(b)는 임계치가 2인 경우로 지지도가 2 이상인 위치정보를 추출한 예를 도시하였다. 이 경우, F와 G는 지지도가 1로 빈발하지 않은 것으로 판단된다. 이와 같이 임계치 이상의 위치정보만을 추출하는 것은 빈발하지 않은 위치정보에서는 서비스 정보 역시 빈발하지 않기 때문이다. 이때, 통합 데이터베이스의 스캔은 한번만 이루어지며 이후에는 통합 데이터베이스의 스캔이 수행되지 않는다. 따라서, 통합 데이터베이스를 스캔하는데 필요한 시간을 효과적으로 단축할 수 있다.FIG. 6 is an exemplary diagram of a header table according to the present invention. FIG. 5 is a diagram illustrating a process of extracting location information satisfying a minimum support degree Min_Sup or more based on information accumulated in an integrated database as shown in FIG. 5. First, as shown in FIG. 6A, information obtained by extracting and counting each positional information generated in FIG. 6 regardless of time is generated, and the positional information of each positional information, that is, the count is greater than or equal to a preset threshold value, is generated. Bay is extracted to generate a header table as shown in FIG. FIG. 6 (b) shows an example in which location information having a support degree of 2 or more is extracted with a threshold value of 2. FIG. In this case, it is judged that F and G do not have frequent support of 1. This is because only the location information above the threshold value is extracted because the service information is not frequent in the frequent location information. At this time, the scan of the integrated database is performed only once, and then the scan of the integrated database is not performed. Thus, the time required to scan the integrated database can be effectively reduced.

다음으로, 도 6(b)와 같이 빈발하는 위치정보를 기반으로 생성된 헤더 테이블을 바탕으로 하여 트리를 구성한다.Next, a tree is constructed based on the header table generated based on frequent location information as shown in FIG. 6 (b).

도 7은 본 발명에 따른 위치정보 및 서비스 정보의 트리를 도시한 도이다. 도 7에서 위에 도시한 트리는 위치정보를 바탕으로 구성한 트리이며, 아래에 도시한 트리는 서비스 정보를 바탕으로 구성한 트리이다.7 is a diagram illustrating a tree of location information and service information according to the present invention. In FIG. 7, the tree shown above is a tree constructed based on location information, and the tree shown below is a tree constructed based on service information.

먼저, 도 7에서 위치정보 트리를 생성하는 과정을 설명하면 이하와 같다. 위치정보 트리에서 A, B, C, D 및 E는 도 5의 통합 로그 데이터에 포함된 위치정보 이고, 숫자는 각 위치정보의 지지도 카운트, 즉 해당 위치정보가 상기 위치정보 트리의 패턴으로 발생한 수를 나타낸다.First, a process of generating a location information tree in FIG. 7 will be described. In the location information tree, A, B, C, D, and E are location information included in the consolidated log data of FIG. 5, and the number is a support count of each location information, that is, the number of location information generated as a pattern of the location information tree. Indicates.

1) 먼저, 루트를 Null 값으로 생성한다.1) First, create a root as a null value.

2) 도 5의 로그 데이터 중 유저 ID 100의 T1에서의 행동패턴 <A:1 B:2 C:5 D:8>를 트리로 구성한다. 이때, A --> B --> C --> D는 시퀀스 정보로 순서를 갖는다. 이는 모바일 유저가 동일 시간에 동일한 일을 동시에 할 수 없기 때문이다.2) The behavior pattern <A: 1 B: 2 C: 5 D: 8> in T1 of the user ID 100 is configured as a tree among the log data of FIG. 5. At this time, A-> B-> C-> D has a sequence as sequence information. This is because mobile users cannot simultaneously do the same thing at the same time.

3) 유저 ID 100의 T2에서의 위치정보(A --> D --> E)에 대하여 동일한 방법으로 트리를 구성한다. 이때, A는 이미 트리에 생성되어 있으므로 2)에서 생성된 트리의 A에 카운트를 올려주고, D는 트리에 없는 정보이므로 새로 가지를 생성한다.3) A tree is constructed in the same manner with respect to the location information (A-> D-> E) in T2 of the user ID 100. At this time, since A is already created in the tree, the count is increased to A of the tree generated in 2), and D is newly generated because the information is not in the tree.

4) 상기와 같은 방법으로 유저 ID 100에 대하여 T6까지 트리를 구성한 후, 나머지 유저 ID 101과 102에 대하여도 동일한 방법으로 트리를 구성한다. 이때, 유저 ID 100의 T4에서의 위치정보 C --> F와 같이 지지도에 의해 도 6의 헤더 테이블에서 제거된 위치정보가 포함된 경우, 위치정보 C는 헤더 테이블에 포함된 위치정보이므로, 트리에서 카운트를 올려주고, 위치정보 F는 헤더 테이블에 포함되지 않은 위치정보이므로 노드를 생성하지 않는다.4) After the tree is constructed up to T6 for the user ID 100 in the same manner as described above, the tree is constructed in the same manner for the remaining user IDs 101 and 102. In this case, when the location information removed from the header table of FIG. 6 by the support degree is included, such as the location information C-> F in T4 of the user ID 100, the location information C is location information included in the header table. In the count up, the location information F is not included in the header table, so do not create a node.

이와 같이 위치정보에 대한 트리가 완성되면, 서비스 정보에 대한 트리를 생성한 후 위치정보 트리의 테일 노드에 링크로 연결한다. 도 7에서는 서비스 정보에 대한 트리 중 A --> B --> C --> D, A --> B --> E, A --> D --> E에 대한 서비 스 정보 트리만을 도시하였다. 도 7에 도시한 바와 같이, 서비스 정보의 헤더 테이블은 해당 트리의 패스에 대한 타임 스탬프가 기록된다. 서비스 정보에 대한 트리를 생성하는 과정을 설명하면 이하와 같다.When the tree for the location information is completed as described above, the tree for the service information is generated and connected to the tail node of the location information tree by a link. FIG. 7 shows only a service information tree for A-> B-> C-> D, A-> B-> E, A-> D-> E of a tree for service information. It was. As shown in Fig. 7, the header table of the service information records a time stamp of a path of the tree. A process of generating a tree for service information is described below.

먼저, 위치정보 트리 중 A:9 --> B:7 --> C:3 --> D:3에서 D:3에 대한 서비스 트리를 구성한다. D:3에서 알 수 있듯이 카운트는 3으로, 이는 3개의 서비스 트리가 정상적으로 필요하다는 것을 의미한다.First, the service tree for D: 3 is constructed from A: 9-> B: 7-> C: 3-> D: 3 of the location information tree. As you can see from D: 3, the count is 3, which means that three service trees are normally needed.

우선 루트를 Null 값으로 생성하고, 도 5의 통합 로그 데이터 중 A --> B --> C --> D의 위치정보 패턴을 갖는 행동패턴에 대하여 서비스 정보를 트리로 구성한다. 도 5에서 이러한 조건을 만족하는 행동패턴은, 유저 ID 100 T1 <A:1 B:2 C:5 D8>, 유저 ID 101 T1 <A:1 B:3 C:5 D:8>, 그리고 유저 ID 102 T1 <A:3 B:6 C:8 D:7>가 있다.First, a route is generated as a null value, and service information is configured as a tree with respect to the behavior pattern having the location information pattern of A-> B-> C-> D among the integrated log data of FIG. 5. In FIG. 5, the behavior pattern that satisfies these conditions is User ID 100 T1 <A: 1 B: 2 C: 5 D8>, User ID 101 T1 <A: 1 B: 3 C: 5 D: 8>, and User. ID 102 T1 <A: 3 B: 6 C: 8 D: 7>.

먼저, 유저 ID 100 T1 <A:1 B:2 C:5 D:8>에 대하여 서비스 정보 1 --> 2 --> 5 --> 8의 트리를 구성하고 카운트를 기록한다. 트리 1:2 -> 2:1 -> 5:1 -> 8:1에서 앞의 숫자는 서비스 정보를 나타내고, 뒤의 숫자는 카운트 정보를 나타낸다. 이때, 헤더 테이블에는 각 노드의 레벨과 노드의 타임 스탬프가 기록된다. 서비스 정보의 헤더 테이블의 각 타임 스탬프와 서비스 정보 트리의 각 노드를 연결한다.First, a tree of service information 1-> 2-> 5-> 8 is formed for user ID 100 T1 <A: 1 B: 2 C: 5 D: 8> and the count is recorded. In Tree 1: 2-> 2: 1-> 5: 1-> 8: 1, the first number represents service information and the second number represents count information. At this time, the level of each node and the time stamp of the node are recorded in the header table. Associate each time stamp in the header table of service information with each node in the service information tree.

다음으로, 유저 ID 101 T1 <A:1 B:3 C:5 D:8>에 대하여 트리를 구성한다. 이때, 서비스 정보 1은 이미 생성된 노드이므로 상기 서비스 정보의 카운트만 올려주고, 다음의 위치정보 3 --> 5 --> 8은 생성되지 않은 노드이므로 서비스 정보 1의 노드에 연결되는 트리를 새로 생성한다. 상기에서 생성된 트리의 각 노드와 새 로 생성된 트리의 각 노드를 연결한다.Next, a tree is constructed for user ID 101 T1 <A: 1 B: 3 C: 5 D: 8>. In this case, since the service information 1 is a node that has already been created, only the count of the service information is increased, and the next location information 3-> 5-> 8 is a node that has not been created. Create Connect each node of the tree created above and each node of the newly created tree.

이후, 유저 ID 102 T1 <A:3 B:6 C:8 D:7>에 대한 트리를 구성한다. 이때, 서비스 정보 3 --> 6 --> 8--> 7은 아직 생성되지 않은 노드이므로 루트에 연결되는 새로운 트리를 생성한다. 새로 생성된 트리의 각 노드를 미리 생성된 트리의 각 노드와 연결한다.Thereafter, a tree for the user ID 102 T1 <A: 3 B: 6 C: 8 D: 7> is constructed. At this time, since service information 3-> 6-> 8-> 7 is a node that has not been created yet, a new tree connected to the root is created. Connect each node of the newly created tree with each node of the previously created tree.

이와 같은 방법으로 나머지 테일 노드에 대한 서비스 정보의 트리를 생성한다.In this way, a tree of service information for the remaining tail nodes is generated.

도 7과 같이 위치정보 및 서비스 정보에 대한 트리가 생성되면, 시간에 따른 모바일 유저의 유용한 행동패턴을 추출하기 위하여 생성된 트리 중 빈발하는 패스를 추출하여야 한다.When a tree for location information and service information is generated as shown in FIG. 7, frequent paths of the generated tree must be extracted to extract useful behavior patterns of mobile users over time.

도 8 및 도 9는 도 7의 트리로부터 빈발한 트리 패스를 추출한 도로서, 빈발도가 2 이상인 트리 패스를 추출한 예시도이다. 도 8 및 도 9에 도시한 바와 같이, 도 9의 트리로부터 위치정보와 서비스 정보의 빈발도가 미리 설정된 값 이상인 트리 패스만을 추출하여 빈발한 트리 패스를 추출하게 된다.8 and 9 are diagrams illustrating the extraction of frequent tree paths from the tree of FIG. 7 and an example of extraction of tree paths having a frequency of two or more. As shown in Figs. 8 and 9, only a tree path having a frequency of position information and service information more than a preset value is extracted from the tree of Fig. 9 to extract a frequent tree path.

먼저, 도 8은 도 7의 트리 중 위치정보의 빈발도가 2 이상인 트리 패스만을 추출한 도이다. 도 8에 도시한 바와 같이, 도 7의 트리 중 트리 패스 E --> D, C --> B, B --> C --> D에서 테일 노드 D, B, D는 위치정보의 빈발도가 1이므로 가지치기 된다.First, FIG. 8 is a diagram illustrating only a tree path having a frequency of two or more of location information in the tree of FIG. 7. As shown in FIG. 8, in the tree paths E-> D, C-> B, B-> C-> D of the tree of FIG. 7, the tail nodes D, B, and D are frequent views of location information. Is 1 so it is pruned.

다음으로, 도 9는 도 8의 트리 중 서비스 정보의 빈발도가 2 이상인 트리 패 스만을 추출한 도로서, 타임 스탬프 T1에서 서비스 정보의 트리 패스 3 --> 6 --> 8 --> 7에서 서비스 정보가 7인 경우는 빈발도가 1이므로 가지치기 된다. 마찬가지로, 타임 스탬프 T2 및 T6에서 서비스 정보의 트리 패스 1 --> 1 --> 2에서 서비스 정보가 2인 경우의 빈발도 역시 1이므로 가지치기 된다.Next, FIG. 9 is a diagram of extracting only a tree pass whose frequency of service information is 2 or more in the tree of FIG. 8, wherein the tree path 3 of the service information 3-> 6-> 8-> 7 in time stamp T1. If the service information is 7, the frequency is 1, so it is pruned. Similarly, frequent occurrences when the service information is 2 in the tree paths 1-> 1-> 2 of the service information in the time stamps T2 and T6 are also pruned.

이와 같이 빈발하지 않은 트리 패스를 모두 제거한 후 도 9와 같이 최소 지지도 이상인 패턴, 즉 빈발한 트리 패스를 추출할 수 있게 된다. 도 9와 같이 추출된 트리 패스를 통해, 타임 스탬프 T1(06:00 ~ 10:00)에서 빈발하는 유용한 행동패턴은 A:1, B:2(또는B:3), C:5 및 D:8임을 확인할 수 있고, 타임 스탬프 T3(14:00 ~ 18:00)와 T6(02:00 ~ 06:00)에서 빈발하는 유용한 행동패턴은 A:2, B:2, E:1임을 확인할 수 있다.After removing all non-frequent tree paths, a pattern having a minimum support degree or more, as shown in FIG. 9, can be extracted. Through the extracted tree path as shown in FIG. 9, useful behavior patterns frequently occurring at time stamps T1 (06:00 to 10:00) are A: 1, B: 2 (or B: 3), C: 5 and D: You can see that it is 8, and useful patterns of frequent behavior in the time stamps T3 (14:00 ~ 18:00) and T6 (02:00 ~ 06:00) are A: 2, B: 2, and E: 1. have.

이러한 방법으로 시간대별 모든 유용한 행동패턴을 찾아낼 수 있다.In this way, you can find all the useful patterns over time.

본 발명의 바람직한 실시예가 특정 용어들을 사용하여 기술되어 왔지만, 그러한 기술은 오로지 설명을 하기 위한 것이며, 다음의 청구범위의 기술적 사상 및 범위로부터 이탈되지 않고서 여러가지 변경 및 변화가 가해질 수 있는 것으로 이해되어져야 한다.While the preferred embodiments of the present invention have been described using specific terms, such descriptions are for illustrative purposes only and it should be understood that various changes and modifications can be made without departing from the spirit and scope of the following claims. do.

도 1은 지능형 미들웨어 플렛폼과 마이닝 모듈이 통합된 시스템 구성을 도시한 도.1 is a diagram illustrating a system configuration in which an intelligent middleware platform and a mining module are integrated.

도 2는 본 발명에 따른 시간에 따른 모바일 유저의 빈발한 행동패턴을 추출하기 위한 시스템 구성도.2 is a system configuration for extracting a frequent behavior pattern of a mobile user over time according to the present invention.

도 3은 본 발명에 따른 시간에 따른 모바일 유저의 빈발한 행동패턴을 추출하는 과정의 흐름도.3 is a flowchart of a process of extracting a frequent behavior pattern of a mobile user over time according to the present invention.

도 4는 본 발명에 따른 타임 스탬프의 예시도.4 is an illustration of a time stamp in accordance with the present invention.

도 5는 본 발명에 따른 통합 로그 데이터의 예시도.5 is an exemplary diagram of consolidated log data in accordance with the present invention.

도 6은 본 발명에 따른 헤더 테이블의 예시도.6 is an exemplary diagram of a header table according to the present invention.

도 7은 본 발명에 따른 위치정보 및 서비스 정보의 트리를 도시한 도.7 is a diagram illustrating a tree of location information and service information according to the present invention.

도 8 및 도 9는 도 7의 트리로부터 빈발한 트리 패스를 추출한 도.8 and 9 are diagrams showing the frequent tree paths extracted from the tree of FIG.

Claims (6)

모바일 유저의 시간대별 행동패턴을 트리 구조로 변환한 후 빈발한 트리 패스를 추출하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법으로서,As a method of extracting a frequent behavior pattern of a mobile user according to a time of converting a behavior pattern of a mobile user's time zone into a tree structure and extracting a frequent tree path, 하루를 일정 시간 단위로 구분한 타임 스탬프를 정의하는 제 1 단계;A first step of defining a time stamp for dividing the day into a predetermined time unit; 타임 스탬프에서 정의된 시간대별로 각 모바일 유저의 위치정보 및 서비스 정보를 통합하여, 상기 모바일 유저의 유저 ID, 상기 타임 스탬프, 그리고 상기 위치정보 및 상기 위치정보에 따른 서비스 정보로 구성되는 상기 각 모바일 유저에 대한 시간대별 행동패턴을 포함하는 통합 로그 데이터를 생성하고 통합 데이터베이스에 저장하는 제 2 단계;The location information and service information of each mobile user are integrated for each time zone defined in the time stamp, and the mobile user includes a user ID of the mobile user, the time stamp, and service information according to the location information and the location information. A second step of generating integrated log data including a time-phased behavioral pattern for and storing in the integrated database; 상기 통합 데이터베이스를 스캔하여, 상기 통합 로그 데이터의 행동패턴 중 임계치 이상의 지지도를 갖는 위치정보를 추출하여 헤더 테이블을 생성하는 제 3 단계;A third step of scanning the unified database and extracting location information having a support level greater than or equal to a threshold value among behavior patterns of the unified log data to generate a header table; 상기 헤더 테이블을 기반으로 하여, 상기 통합 로그 데이터의 행동패턴에 포함된 위치정보 패턴에 대한 위치정보 트리를 구성하는 제 4 단계;A fourth step of constructing a location information tree for the location information pattern included in the behavior pattern of the integrated log data based on the header table; 상기 각 위치정보 패턴에 따른 서비스 정보 패턴에 대한 서비스 정보 트리를 구성하는 제 5 단계; 및A fifth step of constructing a service information tree for a service information pattern according to each location information pattern; And 제 4 단계 및 제 5 단계에서 생성된 위치정보 트리 및 서비스 정보 트리 중 빈발한 트리 패스를 추출하는 제 6 단계를 포함하는 것을 특징으로 하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법.And a sixth step of extracting a frequent tree path among the location information tree and the service information tree generated in the fourth and fifth steps. 제 1 항에 있어서,The method of claim 1, 상기 제 3 단계가,The third step, 상기 통합 데이터베이스를 스캔하여 상기 통합 로그 데이터의 행동패턴에 포함된 각 위치정보를 순서에 무관하게 카운트하는 제 3-1 단계; 및Step 3-1 of scanning the unified database and counting each location information included in the behavior pattern of the unified log data irrespective of the order; And 상기 카운트된 정보가 상기 임계치 보다 작은 위치정보를 제거하는 제 3-2 단계를 포함하는 것을 특징으로 하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법.And a step 3-2 of eliminating the location information whose counted information is smaller than the threshold value. 제 1 항에 있어서,The method of claim 1, 상기 제 4 단계가,The fourth step, 루트에 널(Null) 값을 부여하는 제 4-1 단계; 및Step 4-1 of assigning a null value to the root; And 상기 통합 로그 데이터의 각 유저 ID에 대하여 각 타임 스탬프의 행동패턴에 포함된 시퀀스한 위치정보를 각기 노드로 생성하고 서로 연결하는 제 4-2 단계를 포함하고,A step 4-2 of generating sequenced position information included in the behavior pattern of each time stamp for each user ID of the integrated log data to each node and connecting them to each other; 상기 각 노드에는, 상기 노드에 생성된 위치정보 및 상기 각 노드까지의 트리 패스에 대응하는 위치정보 패턴이 발생한 카운트를 포함하는 것을 특징으로 하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법.Each node includes a count of occurrences of location information generated in the node and a location information pattern corresponding to a tree path to each node. 제 3 항에 있어서,The method of claim 3, wherein 상기 제 4-2 단계에서,In step 4-2, 상기 각 타임 스탬프의 행동패턴에 포함된 시퀀스한 위치정보가, 상기 위치정보 트리의 노드에 이미 생성된 경우 새로운 노드를 생성하는 대신 기존 노드의 카운트를 올려주는 것을 특징으로 하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법.When the sequenced location information included in the behavior pattern of each time stamp is already generated in a node of the location information tree, the count of the existing node is increased instead of generating a new node. Frequent behavior pattern extraction method. 제 3 항에 있어서,The method of claim 3, wherein 상기 제 5 단계가,The fifth step, 루트에 널(Null) 값을 부여하는 제 5-1 단계;Step 5-1 of assigning a null value to the root; 상기 통합 로그 데이터의 행동패턴에 포함된 각 서비스 정보 중, 상기 위치정보 트리의 각 트리 패스에 포함된 위치정보 패턴에 대한 서비스 정보로 노드를 구성하고 서로 연결하는 제 5-2 단계;Step 5-2 of forming a node with service information of location information patterns included in each tree path of the location information tree among the service information included in the behavior pattern of the integrated log data, and connecting each other; 각 서비스 정보 트리의 루트를 대응하는 위치정보 트리의 트리 패스의 테일 노드에 연결하는 제 5-3 단계; 및A fifth step of connecting the root of each service information tree to a tail node of a tree path of a corresponding location information tree; And 각 노드의 레벨 및 타임 스탬프를 포함하는 서비스 정보 트리 헤더 테이블의 각 타임 스탬프와 상기 각 노드를 연결하는 제 5-4 단계를 포함하고,A fifth step of connecting each node with each time stamp of a service information tree header table including a level and a time stamp of each node, 상기 서비스 트리의 각 노드가, 상기 서비스 정보 및 상기 각 노드까지의 트리 패스에 대응하는 서비스 정보 패턴이 발생한 카운트를 포함하는 것을 특징으로 하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법.And each node of the service tree includes a count of occurrences of service information patterns corresponding to the service information and the tree paths to the respective nodes. 제 5 항에 있어서,The method of claim 5, wherein 상기 제 6 단계가,The sixth step, 상기 위치정보 트리에 대하여, 트리 패스의 각 노드의 카운트가 미리 설정된 빈발도 보다 작은 경우, 해당 트리 패스 및 연결된 서비스 트리를 가지치기하는 제 6-1 단계; 및A step 6-1 of pruning the corresponding tree path and the connected service tree when the count of each node of the tree path is smaller than a predetermined frequency with respect to the location information tree; And 상기 서비스 정보 트리에 대하여, 트리 패스의 각 노드의 카운트가 상기 빈발도 보다 작은 경우, 해당 트리 패스를 가지치기하는 제 6-2 단계를 포함하는 것을 특징으로 하는 시간에 따른 모바일 유저의 빈발한 행동패턴 추출방법.And a step 6-2 of pruning the tree path when the count of each node of the tree path is smaller than the frequency of the service information tree. Pattern extraction method.
KR1020070089311A 2007-09-04 2007-09-04 Method for exctracting frequent access pattern of mobile user with time KR100902485B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020070089311A KR100902485B1 (en) 2007-09-04 2007-09-04 Method for exctracting frequent access pattern of mobile user with time

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020070089311A KR100902485B1 (en) 2007-09-04 2007-09-04 Method for exctracting frequent access pattern of mobile user with time

Publications (2)

Publication Number Publication Date
KR20090024347A KR20090024347A (en) 2009-03-09
KR100902485B1 true KR100902485B1 (en) 2009-06-10

Family

ID=40693232

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020070089311A KR100902485B1 (en) 2007-09-04 2007-09-04 Method for exctracting frequent access pattern of mobile user with time

Country Status (1)

Country Link
KR (1) KR100902485B1 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101848232B1 (en) * 2017-08-07 2018-04-12 주식회사 키위플러스 Automatic analysis method for location behavior pattern and location informaition correction method using the automatic analysis

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101228336B1 (en) * 2011-04-01 2013-01-31 한국과학기술원 Personalization Service Providing Method by Using Mobile Terminal User's Activity Pattern and Mobile Terminal therefor
WO2019138560A1 (en) * 2018-01-12 2019-07-18 株式会社Jtb総合研究所 Information processing device, information processing program, and information processing system

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10304452A (en) 1997-04-24 1998-11-13 Mitsubishi Electric Corp Portable terminal
KR20020024824A (en) * 2000-09-27 2002-04-03 김종민 Computer-based system and method for providing customized information adapted for a customer
KR20050060685A (en) * 2003-12-17 2005-06-22 에스케이 텔레콤주식회사 The understanding method of user's terminal usage pattern information and thereof system
KR20060019320A (en) * 2004-08-27 2006-03-03 브이케이 주식회사 Method for analyzing life pattern by a daily work diary of the positioning system in mobile communication terminal

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH10304452A (en) 1997-04-24 1998-11-13 Mitsubishi Electric Corp Portable terminal
KR20020024824A (en) * 2000-09-27 2002-04-03 김종민 Computer-based system and method for providing customized information adapted for a customer
KR20050060685A (en) * 2003-12-17 2005-06-22 에스케이 텔레콤주식회사 The understanding method of user's terminal usage pattern information and thereof system
KR20060019320A (en) * 2004-08-27 2006-03-03 브이케이 주식회사 Method for analyzing life pattern by a daily work diary of the positioning system in mobile communication terminal

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101848232B1 (en) * 2017-08-07 2018-04-12 주식회사 키위플러스 Automatic analysis method for location behavior pattern and location informaition correction method using the automatic analysis

Also Published As

Publication number Publication date
KR20090024347A (en) 2009-03-09

Similar Documents

Publication Publication Date Title
US10748121B2 (en) Enriching calendar events with additional relevant information
CN102460431B (en) Behavior and the system and method for context data analysis
CN107395697A (en) Push Channel Selection, information push method, device and equipment, computer-readable recording medium
CN106375458B (en) Service calling system, method and device
CN102037481A (en) Method and apparatus for detecting patterns of behavior
EP2690893A2 (en) Method of generating calendar and communication terminal thereof
CN107341033A (en) A kind of data statistical approach, device, electronic equipment and storage medium
EP1929705B1 (en) Device management method using nodes having additional attribute and device management client thereof
CN103154928A (en) Network server arrangement for processing non-parametric, multi-dimensional, spatial and temporal human behavior or technical observations measured pervasively, and related method for the same
CN106027328A (en) Cluster monitoring method and system based on application container deployment
CN103970891B (en) A kind of user interest information querying method based on situation
JP2009099124A (en) Method and system for data construction
CN102902752A (en) Method and system for monitoring log
CN101097619A (en) System and method for monitoring business flowpath
CN103220173A (en) Alarm monitoring method and alarm monitoring system
US20120131030A1 (en) Information management apparatus, information management method, and information control program
CN112311612A (en) Family portrait construction method and device and storage medium
CN103686354A (en) Smart television terminal and method for counting reporting key use behaviors
WO2009069882A1 (en) Sensor network managing apparatus and method thereof
KR100902485B1 (en) Method for exctracting frequent access pattern of mobile user with time
CN104636477A (en) Push list duplicate removal method before information push
CN104679753A (en) Information pushing method and information pushing device
CN110519327A (en) User enlivens type judgement method, device, computer equipment and storage medium
CN101667932B (en) Method of network element equipment log management and device
CN101951623A (en) User behavior statistical method and device based on user events

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20120425

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20130409

Year of fee payment: 5

LAPS Lapse due to unpaid annual fee