KR101328328B1 - Apparatus and method for estimating location using log data - Google Patents

Apparatus and method for estimating location using log data Download PDF

Info

Publication number
KR101328328B1
KR101328328B1 KR1020110144986A KR20110144986A KR101328328B1 KR 101328328 B1 KR101328328 B1 KR 101328328B1 KR 1020110144986 A KR1020110144986 A KR 1020110144986A KR 20110144986 A KR20110144986 A KR 20110144986A KR 101328328 B1 KR101328328 B1 KR 101328328B1
Authority
KR
South Korea
Prior art keywords
place
user
log data
user terminal
estimating
Prior art date
Application number
KR1020110144986A
Other languages
Korean (ko)
Other versions
KR20130076406A (en
Inventor
이수원
강영길
김영호
Original Assignee
숭실대학교산학협력단
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by 숭실대학교산학협력단 filed Critical 숭실대학교산학협력단
Priority to KR1020110144986A priority Critical patent/KR101328328B1/en
Publication of KR20130076406A publication Critical patent/KR20130076406A/en
Application granted granted Critical
Publication of KR101328328B1 publication Critical patent/KR101328328B1/en

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04WWIRELESS COMMUNICATION NETWORKS
    • H04W4/00Services specially adapted for wireless communication networks; Facilities therefor
    • H04W4/02Services making use of location information
    • H04W4/025Services making use of location information using location based information parameters

Abstract

본 발명은 로그 데이터를 이용한 장소 추정 장치 및 그 방법에 관한 것으로, 본 발명의 일 실시예에 따른 장소 추정 장치는 사용자 단말기로부터 로그 데이터를 수집하는 로그 데이터 수집부와, 상기 로그 데이터를 학습하여 사용자에 대한 장소 추정 모델을 생성하는 장소 추정 모델 생성부와, 상기 사용자 단말기로부터 수집되는 로그 데이터를 분석하고, 상기 장소 추정 모델을 이용하여 상기 사용자의 현재 장소를 추정하는 장소 추정부를 포함한다.
이에 따라, 보다 정확한 사용자의 행동 패턴을 분석할 수 있으며, 현재 위치한 장소를 정확하게 추정할 수 있다.
The present invention relates to an apparatus and method for estimating a place using log data. The apparatus for estimating a place according to an embodiment of the present invention includes a log data collection unit for collecting log data from a user terminal and a user by learning the log data. And a place estimating model generating unit for generating a place estimating model for the data; and a place estimating unit for analyzing log data collected from the user terminal and estimating a current place of the user using the place estimating model.
Accordingly, the user's behavior pattern can be analyzed more accurately, and the current location can be accurately estimated.

Description

로그 데이터를 이용한 장소 추정 장치 및 그 방법{APPARATUS AND METHOD FOR ESTIMATING LOCATION USING LOG DATA}Apparatus and method for location estimation using log data {APPARATUS AND METHOD FOR ESTIMATING LOCATION USING LOG DATA}

본 발명은 로그 데이터를 이용한 장소 추정 장치 및 그 방법에 관한 것으로, 더욱 상세하게는 사용자 단말기의 사용 이력을 분석하여 현재 사용자가 위치한 장소를 추정하는 기술이 개시된다.The present invention relates to an apparatus and method for estimating a place using log data, and more particularly, a technique for estimating a place where a current user is located by analyzing a usage history of a user terminal.

스마트폰의 급격한 확산으로 스마트폰에 내장된 다양한 센서를 활용한 상황인지 서비스가 고도화되고 있다. 이에 따라, LBS(Location Based Service)와 같이 GPS 센서를 이용한 위치 정보 서비스를 무료 또는 저가로 쉽게 이용할 수 있게 되면서 다양한 모바일 LBS 활용이 확산되고 있다. 그러나 GPS 센서만을 이용한 위치 인식 방법은 실외에서는 오차범위 5~20m 내의 정확도를 가지지만, 실내, 어반 캐니언(Urban Canyon), 또는 터널 등에서 GPS 신호 세기가 감쇠함으로 인하여 위치 정보를 제공하지 못하는 문제가 있었다.Due to the rapid proliferation of smart phones, the situational awareness service using various sensors embedded in smart phones is being advanced. As a result, location information services using GPS sensors such as LBS (Location Based Service) can be easily and freely used at low cost. However, the location recognition method using only the GPS sensor has an accuracy within the error range of 5 to 20 m outdoors, but there is a problem in that the location information cannot be provided due to the attenuation of the GPS signal strength in the indoor, urban canyon, or tunnel. .

이러한 문제점을 해결하기 위하여 휴대 전화의 기지국 정보, 와이파이(wifi) AP(Acess Point)정보 등을 이용한 복합 측위 방식을 통해 위치 정보를 보완하고자 하는 방법 등이 연구 개발되고 있다. 또한, 정부에서도 이와 관련되어 국내 LBS 시장 활성화와 경쟁력 확보를 위한 법과 제도 개선안을 발표하였다. 위치 정보정확도 향상을 위하여 휴대전화 단말기에 GPS 기능 탑재 의무화를 추진하고, 지하 공간, 실내 공간 등 음영지역 해소 추진을 위한 인프라를 확충 중에 있으며, 통신 사업자, 제조사업자, 포탈 사업자 등이 참여하여 전국적인 무선인터넷 와이파이 AP 위치에 대한 정보 DB를 공동으로 구축 및 운영하도록 하는 법안을 추진 중에 있다. 그러나 인프라를 구축하는데 들어가는 초기 비용이 막대하고, 상대적으로 부정확한 장소 정보를 반환하는 문제점 때문에 정확한 장소를 추론하는 데 혼돈을 야기할수 있다In order to solve this problem, a method for compensating location information through a complex positioning method using a base station information of a mobile phone, Wi-Fi AP (Acess Point) information, etc. has been researched and developed. In addition, the government also announced legislation to improve the domestic LBS market and secure competitiveness. In order to improve the accuracy of location information, we are pursuing mandatory installation of GPS functions in mobile phone terminals, and expanding infrastructure for eliminating shaded areas such as underground and indoor spaces.Telecommunications companies, manufacturers, portal operators, etc. A bill is being made to jointly build and operate a database of information on the location of Internet Wi-Fi APs. However, the initial cost of constructing the infrastructure is enormous, and the problem of returning relatively inaccurate place information can cause confusion in inferring the correct place.

한편, 사용자의 참여 및 공유가 강조되는 웹 2.0의 등장과 함께 사람 간의 관계에 중심을 두는 소셜 네트워크 서비스(Social Network Service : SNS)가 급격하게 성장하고 있다. 초기의 SNS가 웹을 중심으로 제공되었던 반면, 최근에는 3G망의 보급 및 스마트폰의 대중화 등의 모바일 환경의 변화로 인해 모바일과 결합된 SNS의 규모가 커지고 있다. 특히, GPS, 블루투스(bluetooth) 및 와이파이 등을 이용하여 사용자의 현재 위치를 인식할 수 있는 스마트폰의 보급은 기존의 SNS에 사용자의 위치정보를 활용한 위치 기반 SNS를 등장시켰다.Meanwhile, with the advent of Web 2.0, which emphasizes user participation and sharing, social network services (SNS), which focuses on human relationships, are growing rapidly. While SNS was initially provided mainly on the web, the size of SNS combined with mobile is increasing due to changes in the mobile environment such as the spread of 3G networks and the popularization of smartphones. In particular, the spread of smart phones that can recognize a user's current location using GPS, Bluetooth and Wi-Fi has emerged a location-based SNS utilizing the user's location information in the existing SNS.

스마트폰을 이용한 위치 기반 SNS와 관련된 연구로서, 사용자가 설정한 다른 사용자와의 관계 정보를 활용하여 사용자 간 위치정보를 공유하는 서비스에 대한 연구가 이루어진 바 있다. 그러나 이러한 서비스에서는 사용자가 다른 사용자와의 사회적인 관계 정보를 모두 직접 설정해야 하며, 사용자가 관계를 설정하지 않은 다른 사용자에 대해서는 서비스를 제공하지 못한다는 문제가 있다.As a study related to location-based SNS using a smartphone, a study has been conducted on a service for sharing location information between users by using relationship information with other users set by the user. However, in such a service, a user must directly set all social relationship information with another user, and there is a problem in that a service cannot be provided for another user who has not established a relationship.

이에 본 발명자는 스마트폰과 같은 사용자 단말기를 이용하여 사용자의 장소를 추정하는 기술에 대해 연구하게 되었다. 본 발명의 배경이 되는 기술은 대한민국 공개특허공보 제10-2007-0009267호(2007. 01. 18)에 기재되어 있다.Accordingly, the present inventors have studied a technology for estimating a user's place using a user terminal such as a smartphone. The background technology of the present invention is described in Republic of Korea Patent Publication No. 10-2007-0009267 (January 18, 2007).

본 발명이 이루고자 하는 기술적 과제는 사용자 단말기의 사용 이력을 분석하여 현재 사용자가 위치한 장소를 추정하되, 인접 사용자를 그룹화하여 그룹에 따라 현재 사용자가 위치한 장소를 추정하기 위한 것이다.The technical problem to be achieved by the present invention is to estimate the place where the current user is located by analyzing the usage history of the user terminal, and to estimate the place where the current user is located by grouping the adjacent users.

본 발명의 일 실시예에 따른 장소 추정 장치는 사용자 단말기로부터 로그 데이터를 수집하는 로그 데이터 수집부와, 상기 로그 데이터를 학습하여 사용자에 대한 장소 추정 모델을 생성하는 장소 추정 모델 생성부와, 상기 사용자 단말기로부터 수집되는 로그 데이터를 분석하고, 상기 장소 추정 모델을 이용하여 상기 사용자의 현재 장소를 추정하는 장소 추정부를 포함한다.An apparatus for estimating a place according to an embodiment of the present invention includes a log data collector for collecting log data from a user terminal, a place estimating model generator for learning a log data to generate a place estimating model for a user, and the user. And a place estimator for analyzing the log data collected from the terminal and estimating the current place of the user using the place estimation model.

또한, 상기 로그 데이터는 상기 사용자 단말기에 탑재된 위치 센서 또는 근접 센서를 통하여 획득되는 상기 사용자 단말기의 시간, 장소, 인접 사용자 정보 중 적어도 하나를 포함할 수 있다.The log data may include at least one of time, place, and neighbor user information of the user terminal acquired through a position sensor or a proximity sensor mounted on the user terminal.

또한, 상기 사용자 단말기로부터 기 설정된 범위 내에 위치하는 인접 사용자 정보를 그룹화하여 생성된 사용자 그룹 모델을 생성하는 사용자 그룹 모델 생성부를 더 포함하고, 상기 장소 추정부는 상기 장소 추정 모델을 이용하여 상기 사용자 그룹 모델에 따른 상기 사용자에 대한 장소를 추정할 수 있다.The apparatus may further include a user group model generator configured to generate a user group model generated by grouping adjacent user information located within a preset range from the user terminal, wherein the place estimator uses the place estimating model. It is possible to estimate a place for the user according to.

또한, 상기 사용자 단말기는 인접하는 또 다른 사용자 단말기와 블루투스, 와이파이, 3G, 4G 중 적어도 하나의 통신 방식으로 데이터를 통신할 수 있다.In addition, the user terminal may communicate data with another neighboring user terminal in at least one communication method of Bluetooth, Wi-Fi, 3G, 4G.

또한, 나이브 베이즈 분류 알고리즘을 이용하여 상기 장소 추정 모델을 생성하고, EM 군집 알고리즘을 이용하여 상기 사용자 그룹 모델을 생성할 수 있다.In addition, the location estimation model may be generated using a naive Bayes classification algorithm, and the user group model may be generated using an EM clustering algorithm.

본 발명의 또 다른 실시예에 따른 로그 데이터를 이용한 장소 추정 방법은 장소 추정 장치의 로그 데이터를 이용한 장소 추정 방법에 있어서, 사용자 단말기로부터 로그 데이터를 수집하는 단계와, 상기 로그 데이터를 학습하여 사용자에 대한 장소 추정 모델을 생성하는 단계와, 상기 사용자 단말기로부터 새롭게 수집되는 로그 데이터를 분석하고, 상기 장소 추정 모델을 이용하여 상기 사용자의 현재 장소를 추정하는 단계를 포함한다.According to another aspect of the present invention, there is provided a method of estimating a place using log data, the method of estimating a place using log data of a place estimating apparatus, comprising: collecting log data from a user terminal and learning the log data to a user; Generating a location estimation model for the location; and analyzing log data newly collected from the user terminal, and estimating the current location of the user using the location estimation model.

이와 같이, 본 발명에 따르면 사용자 단말기의 사용 이력을 분석하여 현재 사용자가 위치한 장소를 추정하되, 인접 사용자를 그룹화하여 그룹에 따라 현재 사용자가 위치한 장소를 추정함으로써, 보다 정확한 사용자의 행동 패턴을 분석할 수 있으며, 현재 위치한 장소를 정확하게 추정할 수 있다.As described above, according to the present invention, the usage history of the user terminal is estimated to estimate the place where the current user is located, and the neighboring user is grouped to estimate the place where the current user is located according to the group, thereby analyzing a more accurate user behavior pattern. And accurately estimate where you are located.

도 1은 본 발명의 일 실시예에 따른 로그 데이터를 이용한 장소 추정 장치의 구성도,
도 2는 도 1에 따른 장소 추정 장치를 통해 구현되는 장소 추정 방법의 흐름도,
도 3은 도 2에 따른 장소 추정 방법 중 로그 데이터를 분석하여 사용자의 현재 장소를 추정하는 것을 설명하기 위한 예시도,
도 4는 도 2에 따른 장소 추정 방법 중 인접 사용자 정보를 그룹화하여 생성된 사용자 그룹 모델을 이용하여 사용자의 현재 장소를 추정하는 것을 설명하기 위한 예시도이다.
1 is a block diagram of an apparatus for estimating a place using log data according to an embodiment of the present invention;
2 is a flowchart of a place estimating method implemented through the place estimating apparatus according to FIG. 1;
3 is an exemplary diagram for explaining estimating a current place of a user by analyzing log data in the place estimating method according to FIG. 2;
4 illustrates an example of estimating a current place of a user using a user group model generated by grouping adjacent user information in the place estimation method of FIG. 2.

이하, 첨부된 도면들을 참조하여 본 발명의 실시예를 상세하게 설명한다. 사용되는 용어들은 실시예에서의 기능을 고려하여 선택된 용어들로서, 그 용어의 의미는 사용자, 운용자의 의도 또는 판례 등에 따라 달라질 수 있다. 그러므로 후술하는 실시예들에서 사용된 용어의 의미는, 본 명세서에 구체적으로 정의된 경우에는 그 정의에 따르며, 구체적인 정의가 없는 경우는 당업자들이 일반적으로 인식하는 의미로 해석되어야 할 것이다.Hereinafter, embodiments of the present invention will be described in detail with reference to the accompanying drawings. The terms used are terms selected in consideration of the functions in the embodiments, and the meaning of the terms may vary depending on the user, the intention or the precedent of the operator, and the like. Therefore, the meaning of the terms used in the following embodiments is defined according to the definition when specifically defined in this specification, and unless otherwise defined, it should be interpreted in a sense generally recognized by those skilled in the art.

본 발명의 장소 추정 장치는 사용자 단말기의 내부에 탑재될 수 있으며, 서버의 형태로도 구현될 수 있다.
The apparatus for estimating a place of the present invention may be mounted in the user terminal and may be implemented in the form of a server.

도 1은 본 발명의 일 실시예에 따른 로그 데이터를 이용한 장소 추정 장치의 구성도이고, 도 2는 도 1에 따른 장소 추정 장치를 통해 구현되는 장소 추정 방법의 흐름도이다.1 is a configuration diagram of a place estimating apparatus using log data according to an embodiment of the present invention, and FIG. 2 is a flowchart of a place estimating method implemented through the place estimating apparatus according to FIG. 1.

도 1 및 도 2를 참조하면, 본 발명의 일 실시예에 따른 장소 추정 장치(100)는 로그 데이터 수집부(110), 로그 DB(115), 장소 추정 모델 생성부(120), 장소 추정부(130)를 포함한다. 먼저, 로그 데이터 수집부(110)는 사용자 단말기로부터 로그 데이터를 수집하여 로드 DB에 저장한다(S200). 사용자 단말기는 PDA, PMP, 내비게이션, 스마트폰, 태블릿 PC, 노트북과 같은 이동형 단말이며, 이러한 사용자 단말기는 인접하는 또 다른 사용자 단말기와 블루투스, 와이파이, 3G, 4G 중 적어도 하나의 통신 방식으로 데이터를 통신할 수 있다.1 and 2, a place estimating apparatus 100 according to an embodiment of the present invention may include a log data collector 110, a log DB 115, a place estimation model generator 120, and a place estimator. 130. First, the log data collection unit 110 collects log data from the user terminal and stores the log data in the load DB (S200). The user terminal is a mobile terminal such as a PDA, a PMP, a navigation device, a smartphone, a tablet PC, a laptop, and the user terminal communicates data with another neighboring user terminal through at least one of Bluetooth, Wi-Fi, 3G, and 4G. can do.

로그 데이터는 로그 DB(115)에 저장되며, 사용자 단말기에 탑재된 위치 센서 또는 근접 센서를 통하여 획득되는 사용자 단말기의 시간, 장소, 인접 사용자 정보 중 적어도 하나를 포함한다. 예를 들어, 로그 데이터 수집부(110)는 미리 설정된 시간 간격으로 사용자 단말기로부터 로그 데이터를 수집하며, 사용자 단말기는 인접한 사용자 단말기와 블루투스 통신 등에 의한 데이터를 저장하였다가 데이터 인스턴스 명령이 있으면 이를 출력하게 된다. 로그 데이터에는 사용자 단말기가 몇 시에 어떤 사용자 단말기와 통신하였는지에 대한 기록을 포함하며, 통신의 종류는 사용자 단말기 상호 간의 아이디 확인 정도의 통신으로도 로그 데이터를 생성할 수 있다.The log data is stored in the log DB 115 and includes at least one of time, place, and neighbor user information of the user terminal acquired through a position sensor or a proximity sensor mounted on the user terminal. For example, the log data collecting unit 110 collects log data from the user terminal at predetermined time intervals, and the user terminal stores data through Bluetooth communication with an adjacent user terminal and outputs the data instance command if there is a data instance command. do. The log data may include a record of what time the user terminal communicated with which user terminal, and the type of communication may generate log data even by communication of ID confirmation between the user terminals.

다음으로, 장소 추정 모델 생성부(120)는 로그 DB(115)에 저장된 사용자 단말기의 로그 데이터를 학습하여 사용자에 대한 장소 추정 모델을 생성한다(S210). 장소 추정 모델은 일정 기간 동안 사용자 단말기로부터 수집된 로그 데이터를 분석하여, 사용자 단말기가 시간별로 어느 사용자 단말기와 통신하며, 인접한 사용자가 판단되면 해당 사용자와 머물고 있는 장소를 매칭시킴으로써 장소 추정 모델을 생성하게 된다.Next, the place estimation model generator 120 learns log data of the user terminal stored in the log DB 115 and generates a place estimation model for the user (S210). The place estimation model analyzes log data collected from a user terminal for a certain period of time, and generates a place estimation model by matching which user terminal the user terminal communicates with each time, and when the adjacent user is determined, matching the place where the user is staying with the user. do.

또한, 장소 추정 모델 생성부(120)는 나이브 베이즈(Naive Bayes) 분류 알고리즘을 이용하여 상기 장소 추정 모델을 생성할 수 있다. 나이브 베이즈 분류 알고리즘은 로그 데이터로부터 사용자의 장소 추정 모델을 생성하기 위한 것이다. 나이브 베이즈 분류 알고리즘은 베이즈 이론(Bayes Theorem)에 기반한 분류 학습 기법으로 클래스가 알려지지 않은 미지의 샘플 X에 대해 해당 샘플이 특정 클래스 C에 속할 확률 P(C|X)를 결정하여 확률 순위 값이 가장 큰 클래스로 예측하는 방법이다. 이 경우, P(C|X)는 다음의 수학식 1을 이용하여 구할 수 있다.In addition, the place estimation model generator 120 may generate the place estimation model using a naive bayes classification algorithm. The naive Bayes classification algorithm is for generating a user's location estimation model from log data. The naive Bayes classification algorithm is a classification learning technique based on Bayes Theorem that determines the probability P (C | X) for unknown sample X whose class is unknown and determines the probability P (C | X). This is the way to predict with the largest class. In this case, P (C | X) can be obtained using Equation 1 below.

Figure 112011104604652-pat00001
Figure 112011104604652-pat00001

수학식 1에서, C는 클래스, X는 미지의 샘플을 나타낸다. P(X)는 모든 클래스에서 동일한 상수 값을 가지기 때문에 클래스에 속할 확률 순위를 비교하기 위해서는 P(X|C)*P(C)의 값이 필요하다. P(C)의 값은 학습 예제를 통해 구할 수 있으며, P(X|C)는 클래스 변수를 제외한 모든 변수가 서로 독립이라는 가정 하에 학습 예제로부터 구할 수 있는 각 변수별 확률 값의 곱으로 계산할 수 있다. P(X|C)는 다음의 수학식 2를 이용하여 구할 수 있다.In Equation 1, C represents a class and X represents an unknown sample. Since P (X) has the same constant value in all classes, the value of P (X | C) * P (C) is needed to compare the probability rankings belonging to the class. The value of P (C) can be obtained through the learning example, and P (X | C) can be calculated as the product of the probability values of each variable that can be obtained from the learning example under the assumption that all variables except class variables are independent of each other. have. P (X | C) can be obtained using Equation 2 below.

Figure 112011104604652-pat00002
Figure 112011104604652-pat00002

다음으로, 장소 추정부(130)는 사용자 단말기로부터 새롭게 수집되는 로그 데이터를 분석하고, 장소 추정 모델을 이용하여 사용자의 현재 장소를 추정한다(S220). 장소 추정부(130)는 장소 추정 모델 생성부(120)에서 생성된 장소 추정 모델을 이용하여 현재 사용자의 장소를 추정할 수 있다. 이는 현재 장소에서의 사용자 단말기의 로그 데이터를 분석하고, 이를 장소 추정 모델에 적용하여 현재 장소를 추정하게 된다. 이하, 도 3을 참조하여 로그 데이터를 분석하여 사용자의 현재 장소를 추정하는 것을 구체적으로 설명하도록 한다.
Next, the place estimator 130 analyzes the log data newly collected from the user terminal and estimates the user's current place using the place estimation model (S220). The place estimator 130 may estimate a current user's place by using the place estimation model generated by the place estimation model generator 120. It analyzes the log data of the user terminal at the current place and estimates the current place by applying it to the place estimation model. Hereinafter, estimating the current location of the user by analyzing log data will be described in detail with reference to FIG. 3.

도 3은 도 2에 따른 장소 추정 방법 중 로그 데이터를 분석하여 사용자의 현재 장소를 추정하는 것을 설명하기 위한 예시도이다.FIG. 3 is an exemplary diagram for describing estimating a user's current place by analyzing log data in the place estimation method of FIG. 2.

도 3을 참조하면, 사용자 1에 대한 현재 장소를 추정하는 경우, 사용자 단말기로부터 수신된 로그 데이터를 분석하면, 사용자 1은 월요일 8시에 사용자 아이디가 76인 또 다른 사용자와 인접하여 있음을 알 수 있다. 이 경우, 장소 추정 모델 생성부(120)에 의해 생성된 장소 추정 모델에 따르면 월요일 8시에 사용자 아이디 76과 함께하는 장소는 회사로 설정되어 있으며, 장소 추정부(130)는 현재 사용자가 위치하는 장소를 회사로 추정하게 된다. 또한, 사용자 1이 수요일 9시에 사용자 아이디가 76인 사용자와 인접하여 있는 경우, 현재 사용자가 위치하는 장소를 커피숍으로 추정하게 된다.
Referring to FIG. 3, when estimating the current location for user 1, analyzing log data received from the user terminal, it can be seen that user 1 is adjacent to another user whose user ID is 76 at 8:00 on Monday. have. In this case, according to the place estimating model generated by the place estimating model generation unit 120, the place with the user ID 76 at 8:00 on Monday is set as a company, and the place estimating unit 130 is a place where the current user is located. Will be assumed to be the company. In addition, when the user 1 is adjacent to the user whose user ID is 76 at 9:00 on Wednesday, the user's location is estimated as the coffee shop.

한편, 본 발명의 또 다른 실시예에 따른 장소 추정 장치(100)는 사용자 그룹 모델 생성부(140)를 더 포함할 수 있다. 사용자 그룹 모델 생성부(140)는 사용자 단말기로부터 기 설정된 범위 내에 위치하는 인접 사용자 정보를 그룹화하여 생성된 사용자 그룹 모델을 생성한다. 사용자 그룹 모델은 사용자와 인접한 사용자를 그룹화하여 생성되는 모델을 의미한다. 도 3의 경우, 장소 추정 모델은 사용자 전체에 대한 로그 데이터를 이용하여 생성하고, 이를 개별 사용자에게 적용함으로써 추정한 장소가 사용자의 현재 장소와 다를 수 있다. 따라서, 보다 정확한 장소를 추정하기 위해 사용자와 인접한 사용자를 그룹화하여 그룹별로 장소 추정 알고리즘을 적용하게 된다. 이 경우, 장소 추정부(130)는 장소 추정 모델을 이용하여 사용자 그룹 모델에 따른 사용자에 대한 장소를 추정하게 된다. Meanwhile, the place estimating apparatus 100 according to another exemplary embodiment of the present invention may further include a user group model generator 140. The user group model generation unit 140 generates a user group model generated by grouping adjacent user information located within a preset range from the user terminal. The user group model refers to a model generated by grouping users and adjacent users. In the case of FIG. 3, the place estimation model is generated by using log data of the entire user, and the estimated place may be different from the current place of the user by applying the same to individual users. Therefore, in order to estimate a more accurate place, the user and the adjacent user are grouped to apply a place estimation algorithm for each group. In this case, the place estimator 130 estimates a place for the user according to the user group model using the place estimation model.

또한, 그룹 모델 생성부는 EM 군집 알고리즘을 이용하여 사용자 그룹 모델을 생성할 수 있다. EM 군집 알고리즘은 보이지 않는 잠재변수(Latent Variable)에 의존하는 확률 모델에서 보수 (parameter) 들의 최대 우도 추정치(Maximum Likelihood Estimates of Parameters)를 찾는 알고리즘이다. 즉, 예상(Expectation, E) 단계에서는 잠재 변수의 기대치를 계산하고, 최대화(Maximization, M)는 주어진 데이터와 기대치가 부여된 잠재 변수를 이용하여 보수들의 최대 우도 추정치를 계산한다. 예상 단계는 다음의 수학식 3을 통해 구할 수 있으며, 최대화 단계는 다음의 수학식 4를 통해 구할 수 있다.In addition, the group model generator may generate a user group model using an EM clustering algorithm. The EM clustering algorithm is an algorithm for finding the maximum likelihood estimates of parameters in a probability model that depends on invisible latent variables. In the Expectation (E) stage, the expected value of the latent variable is calculated, and Maximization (M) calculates the maximum likelihood estimate of the complements using the given data and the latent variable to which the expected value is assigned. The expected step can be obtained by Equation 3 below, and the maximizing step can be obtained by Equation 4 below.

Figure 112011104604652-pat00003
Figure 112011104604652-pat00003

Figure 112011104604652-pat00004
Figure 112011104604652-pat00004

수학식 3에서 어떠한 모수 θ(t)가 주어졌을 대 새로운 모수 θ를 사용할 때의 관측할 수 있는 확률 변수 X와 관측할 수 없는 확률 변수 Z에 대한 확률 분포의 최대 우도의 기대값 Q를 정의한다. 또한, 수학식 4에서는 최대 우도의 기대값 Q를 최대화하는 새로운 모수 θ(t+1)를 수학식 3에 따라 반복하여 계산하고, 값이 충분히 수렴하는 위치를 찾아서 계산하게 된다.Given a certain parameter θ (t) in Equation 3, we define the expected value Q of the maximum likelihood of the probability distribution for the observable random variable X and the unobservable random variable Z when using the new parameter θ. . In addition, in Equation 4, a new parameter θ (t + 1) maximizing the expected value Q of the maximum likelihood is repeatedly calculated according to Equation 3, and the position where the values sufficiently converge is calculated.

EM 군집 알고리즘을 이용하는 경우, 다음의 표 1과 같은 군집 데이터를 얻을 수 있다.When the EM clustering algorithm is used, cluster data shown in Table 1 below can be obtained.

그룹group 그룹 1Group 1 그룹 2Group 2 그룹 3Group 3 그룹 4Group 4 그룹 5Group 5 사용자 수Number of users 1One 1313 2424 5151 55

표 1을 참조하면, 총 5개의 사용자 그룹을 설정할 수 있으며, 각 그룹의 사용자 수는 EM 군집 알고리즘을 통해 같은 장소에 속하는 사용자의 수를 타나낸다. 예를 들어, 그룹 1의 경우, 아이디가 2, 4, 6, 11, 38, 39, 40, 43, 59, 73, 82인 사용자들이 대상 사용자의 주변에서 동시 출현하는 평균 빈도가 하루에 5~10분 정도인 경우인 사용자들끼리 그룹화된 것이다. 유사한 행동 패턴을 가지는 사용자를 그룹화하여 학습 데이터가 추출되면 그룹별로 앞서 설명한 나이브 베이지 분류 알고리즘을 적용하여 각 그룹에 대한 장소 추정 모델이 생성된다. 표 1의 그룹에 대한 그룹별 장소 추정 모델의 수는 다음의 표 2와 같이 표현될 수 있다.Referring to Table 1, a total of five user groups can be set, and the number of users in each group represents the number of users belonging to the same place through the EM clustering algorithm. For example, in group 1, users with IDs 2, 4, 6, 11, 38, 39, 40, 43, 59, 73, and 82 may have an average frequency of appearing in the vicinity of the target user at 5 ~ 5 per day. Users who are about 10 minutes long are grouped together. When training data is extracted by grouping users having similar behavior patterns, a place estimation model is generated for each group by applying the naive beige classification algorithm described above. The number of place estimation models for each group for the group of Table 1 may be expressed as shown in Table 2 below.

그룹group 그룹 1Group 1 그룹 2Group 2 그룹 3Group 3 그룹 4Group 4 그룹 5Group 5 장소 추정
모델 수
Place estimate
Number of models

76

76

67

67

789

789

4

4

5

5

도 4는 도 2에 따른 장소 추정 방법 중 인접 사용자 정보를 그룹화하여 생성된 사용자 그룹 모델을 이용하여 사용자의 현재 장소를 추정하는 것을 설명하기 위한 예시도이다.4 illustrates an example of estimating a current place of a user using a user group model generated by grouping adjacent user information in the place estimation method of FIG. 2.

도 4를 참조하면, 현재 장소를 추정하고자 하는 대상 사용자 단말기로부터 해당 사용자의 로그 데이터를 수집하여 사용자 그룹 모델과 장소 추정 모델을 이용하여 해당 사용자와 인접한 사용자 그룹을 설정할 수 있다. 예를 들어, 도 4에서 사용자가 월요일 8시에 아이디가 76인 사용자 76과 인접한 위치에 있는 경우, 사용자와 인접한 사용자 76은 그룹 1과 그룹 2에서 동시에 포함되며, 대상 사용자의 행동 특성이 그룹 1로 판정되면 대상 사용자의 현재 장소는 회사로 추정된다. 그러나, 대상 사용자의 행동 특성이 그룹 2로 판정되면 대상 사용자의 현재 장소는 도서관으로 추정된다. 따라서, 도 3과 비교하여 인접 사용자의 행동 특성에 따라 인접 사용자를 그룹화함으로써 대상 사용자의 추정 장소의 범위가 보다 세분화될 수 있다.
Referring to FIG. 4, log data of a corresponding user may be collected from a target user terminal to estimate a current location, and a user group adjacent to the corresponding user may be set using a user group model and a location estimation model. For example, in FIG. 4, if a user is in a location adjacent to user 76 whose ID is 76 at 8:00 on Monday, user and adjacent user 76 are simultaneously included in group 1 and group 2, and the behavioral characteristics of the target user are group 1. If it is determined that the current place of the target user is estimated to be a company. However, if the behavioral characteristics of the target user are determined to be group 2, the current place of the target user is assumed to be a library. Therefore, compared to FIG. 3, the range of the estimated place of the target user may be further divided by grouping the neighboring users according to the behavior characteristics of the neighboring users.

이와 같이, 본 발명에 따르면 사용자 단말기의 사용 이력을 분석하여 현재 사용자가 위치한 장소를 추정하되, 인접 사용자를 그룹화하여 그룹에 따라 현재 사용자가 위치한 장소를 추정함으로써, 보다 정확한 사용자의 행동 패턴을 분석할 수 있으며, 현재 위치한 장소를 정확하게 추정할 수 있다.
As described above, according to the present invention, the usage history of the user terminal is estimated to estimate the place where the current user is located, and the neighboring user is grouped to estimate the place where the current user is located according to the group, thereby analyzing a more accurate user behavior pattern. And accurately estimate where you are located.

한편, 본 발명의 일 실시예는 컴퓨터에 의해 실행되는 프로그램 모듈과 같은 컴퓨터에 의해 실행가능한 명령어를 포함하는 기록 매체의 형태로도 구현될 수 있다. 컴퓨터 판독 가능 매체는 컴퓨터에 의해 액세스될 수 있는 임의의 가용 매체일 수 있고, 휘발성 및 비휘발성 매체, 분리형 및 비분리형 매체를 모두 포함한다. 또한, 컴퓨터 판독 가능 매체는 컴퓨터 저장 매체 및 통신 매체를 모두 포함할 수 있다. 컴퓨터 저장 매체는 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈 또는 기타 데이터와 같은 정보의 저장을 위한 임의의 방법 또는 기술로 구현된 휘발성 및 비휘발성, 분리형 및 비분리형 매체를 모두 포함한다. 통신 매체는 전형적으로 컴퓨터 판독가능 명령어, 데이터 구조, 프로그램 모듈, 또는 반송파와 같은 변조된 데이터 신호의 기타 데이터, 또는 기타 전송 메커니즘을 포함하며, 임의의 정보 전달 매체를 포함한다.
Meanwhile, an embodiment of the present invention may also be implemented in the form of a recording medium including instructions executable by a computer, such as a program module executed by the computer. Computer readable media can be any available media that can be accessed by a computer and includes both volatile and nonvolatile media, removable and non-removable media. In addition, the computer-readable medium may include both computer storage media and communication media. Computer storage media includes both volatile and nonvolatile, removable and non-removable media implemented in any method or technology for storage of information such as computer readable instructions, data structures, program modules or other data. Communication media typically includes any information delivery media, including computer readable instructions, data structures, program modules, or other data in a modulated data signal such as a carrier wave, or other transport mechanism.

이상에서 본 발명은 도면을 참조하면서 기술되는 바람직한 실시예를 중심으로 설명되었지만 이에 한정되는 것은 아니다. 따라서 본 발명은 기재된 실시예로부터 도출 가능한 자명한 변형예를 포괄하도록 의도된 특허청구범위의 기재에 의해 해석되어져야 한다.While the present invention has been particularly shown and described with reference to exemplary embodiments thereof, Therefore, the present invention should be construed as a description of the claims which are intended to cover obvious variations that can be derived from the described embodiments.

100 : 장소 추정 장치
110 : 로그 데이터 수집부
115 : 로그 DB
120 : 장소 추정 모델 생성부
130 : 장소 추정부
140 : 사용자 그룹 모델 생성부
100: place estimation device
110: log data collection unit
115: log DB
120: place estimation model generator
130: place estimation unit
140: user group model generation unit

Claims (10)

사용자 단말기로부터 제1 로그 데이터를 수집하는 로그 데이터 수집부;
상기 제1 로그 데이터를 학습하여 나이브 베이즈 분류 알고리즘을 이용하여 사용자에 대한 장소 추정 모델을 생성하는 장소 추정 모델 생성부; 및
상기 사용자 단말기로부터 수집되는 제2 로그 데이터를 분석하고, 상기 장소 추정 모델을 이용하여 상기 사용자의 현재 장소를 추정하는 장소 추정부를 포함하며,
상기 제1 및 제2 로그 데이터는 상기 사용자 단말기에 탑재된 위치 센서 또는 근접 센서를 통하여 획득되며,
상기 제1 로그 데이터는 상기 사용자 단말기의 시간, 장소, 인접 사용자 정보 중 적어도 하나를 포함하고, 상기 제2 로그 데이터는 상기 사용자 단말기의 시간, 인접 사용자 정보 중 적어도 하나를 포함하는 로그 데이터를 이용한 장소 추정 장치.
A log data collecting unit collecting first log data from a user terminal;
A place estimation model generator for learning the first log data and generating a place estimation model for a user using a naive Bayes classification algorithm; And
A place estimating unit configured to analyze second log data collected from the user terminal and estimate a current place of the user using the place estimating model,
The first and second log data is obtained through a position sensor or a proximity sensor mounted on the user terminal,
The first log data includes at least one of time, place, and neighbor user information of the user terminal, and the second log data is a place using log data including at least one of time, neighbor user information of the user terminal. Estimation device.
삭제delete 제1항에 있어서,
상기 사용자 단말기로부터 기 설정된 범위 내에 위치하는 인접 사용자 정보를 그룹화하여 상기 나이브 베이즈 분류 알고리즘 및 EM 군집 알고리즘을 이용하여 사용자 그룹 모델을 생성하는 사용자 그룹 모델 생성부를 더 포함하고,
상기 장소 추정부는 상기 장소 추정 모델을 이용하여 상기 사용자 그룹 모델에 따른 상기 사용자에 대한 장소를 추정하는 로그 데이터를 이용한 장소 추정 장치.
The method of claim 1,
And a user group model generator configured to group adjacent user information located within a preset range from the user terminal and generate a user group model using the naive Bayes classification algorithm and an EM clustering algorithm.
And the place estimating unit uses log data to estimate a place for the user according to the user group model using the place estimating model.
제1항에 있어서,
상기 사용자 단말기는 인접하는 또 다른 사용자 단말기와 블루투스, 와이파이, 3G, 4G 중 적어도 하나의 통신 방식으로 데이터를 통신하는 로그 데이터를 이용한 장소 추정 장치.
The method of claim 1,
The user terminal is a place estimation device using the log data for communicating data with another adjacent user terminal in at least one communication method of Bluetooth, Wi-Fi, 3G, 4G.
삭제delete 장소 추정 장치의 로그 데이터를 이용한 장소 추정 방법에 있어서,
사용자 단말기로부터 제1 로그 데이터를 수집하는 단계;
상기 제1 로그 데이터를 학습하여 나이브 베이즈 분류 알고리즘을 이용하여 사용자에 대한 장소 추정 모델을 생성하는 단계; 및
상기 사용자 단말기로부터 수집되는 제2 로그 데이터를 분석하고, 상기 장소 추정 모델을 이용하여 상기 사용자의 현재 장소를 추정하는 단계를 포함하며,
상기 제1 로그 데이터는 상기 사용자 단말기의 시간, 장소, 인접 사용자 정보 중 적어도 하나를 포함하고, 상기 제2 로그 데이터는 상기 사용자 단말기의 시간, 인접 사용자 정보 중 적어도 하나를 포함하는 로그 데이터를 이용한 장소 추정 방법.
In the place estimation method using the log data of the place estimation device,
Collecting first log data from a user terminal;
Learning the first log data to generate a location estimation model for the user using a naive Bayes classification algorithm; And
Analyzing second log data collected from the user terminal and estimating the current place of the user using the place estimating model,
The first log data includes at least one of time, place, and neighbor user information of the user terminal, and the second log data is a place using log data including at least one of time, neighbor user information of the user terminal. Estimation method.
삭제delete 제6항에 있어서,
상기 사용자 단말기로부터 기 설정된 범위 내에 위치하는 인접 사용자 정보를 그룹화하여 상기 나이브 베이즈 분류 알고리즘 및 EM 군집 알고리즘을 이용하여 사용자 그룹 모델을 생성하는 단계를 더 포함하고,
상기 사용자의 현재 장소를 추정하는 단계는,
상기 장소 추정 모델을 이용하여 상기 사용자 그룹 모델에 따른 상기 사용자에 대한 장소를 추정하는 로그 데이터를 이용한 장소 추정 방법.
The method according to claim 6,
Grouping adjacent user information located within a preset range from the user terminal to generate a user group model using the naive Bayes classification algorithm and an EM clustering algorithm,
Estimating the current place of the user,
And a place estimating method using log data for estimating a place for the user according to the user group model using the place estimating model.
제6항에 있어서,
상기 사용자 단말기는 인접하는 또 다른 사용자 단말기와 블루투스, 와이파이, 3G, 4G 중 적어도 하나의 통신 방식으로 데이터를 통신하는 로그 데이터를 이용한 장소 추정 방법.
The method according to claim 6,
Wherein the user terminal is a location estimation method using the log data for communicating data with another adjacent user terminal in at least one communication method of Bluetooth, Wi-Fi, 3G, 4G.
삭제delete
KR1020110144986A 2011-12-28 2011-12-28 Apparatus and method for estimating location using log data KR101328328B1 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
KR1020110144986A KR101328328B1 (en) 2011-12-28 2011-12-28 Apparatus and method for estimating location using log data

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
KR1020110144986A KR101328328B1 (en) 2011-12-28 2011-12-28 Apparatus and method for estimating location using log data

Publications (2)

Publication Number Publication Date
KR20130076406A KR20130076406A (en) 2013-07-08
KR101328328B1 true KR101328328B1 (en) 2013-11-11

Family

ID=48990007

Family Applications (1)

Application Number Title Priority Date Filing Date
KR1020110144986A KR101328328B1 (en) 2011-12-28 2011-12-28 Apparatus and method for estimating location using log data

Country Status (1)

Country Link
KR (1) KR101328328B1 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11243835B1 (en) 2020-12-03 2022-02-08 International Business Machines Corporation Message-based problem diagnosis and root cause analysis
US11403326B2 (en) 2020-12-03 2022-08-02 International Business Machines Corporation Message-based event grouping for a computing operation
US11474892B2 (en) 2020-12-03 2022-10-18 International Business Machines Corporation Graph-based log sequence anomaly detection and problem diagnosis
US11513930B2 (en) 2020-12-03 2022-11-29 International Business Machines Corporation Log-based status modeling and problem diagnosis for distributed applications
US11599404B2 (en) 2020-12-03 2023-03-07 International Business Machines Corporation Correlation-based multi-source problem diagnosis
US11797538B2 (en) 2020-12-03 2023-10-24 International Business Machines Corporation Message correlation extraction for mainframe operation

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR101524971B1 (en) * 2014-02-11 2015-06-02 숭실대학교산학협력단 Personality traits prediction method and apparatus based on consumer psychology
KR102382701B1 (en) 2015-09-02 2022-04-06 삼성전자 주식회사 A User Terminal Device And Method For Recognizing User Location Using Sensor-based Activity Recognition
CN109656778B (en) * 2018-11-28 2022-07-12 金蝶软件(中国)有限公司 Data acquisition method and device, computer equipment and storage medium

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000058851A (en) * 2000-07-03 2000-10-05 김용환 System and Method for Providing Information on Adjacent Area

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20000058851A (en) * 2000-07-03 2000-10-05 김용환 System and Method for Providing Information on Adjacent Area

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
박한샘 외 1명,'동적 베이지안 네트워크를 이용한 모바일 라이프로그 기반 사용자 행동 예측', 제30회 한국정보처리학회 추계학술발표대회 논문집, 제15권, 제2호, 페이지 60~63, 11월, 2008년. *

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US11243835B1 (en) 2020-12-03 2022-02-08 International Business Machines Corporation Message-based problem diagnosis and root cause analysis
US11403326B2 (en) 2020-12-03 2022-08-02 International Business Machines Corporation Message-based event grouping for a computing operation
US11474892B2 (en) 2020-12-03 2022-10-18 International Business Machines Corporation Graph-based log sequence anomaly detection and problem diagnosis
US11513930B2 (en) 2020-12-03 2022-11-29 International Business Machines Corporation Log-based status modeling and problem diagnosis for distributed applications
US11599404B2 (en) 2020-12-03 2023-03-07 International Business Machines Corporation Correlation-based multi-source problem diagnosis
US11797538B2 (en) 2020-12-03 2023-10-24 International Business Machines Corporation Message correlation extraction for mainframe operation

Also Published As

Publication number Publication date
KR20130076406A (en) 2013-07-08

Similar Documents

Publication Publication Date Title
KR101328328B1 (en) Apparatus and method for estimating location using log data
Laoudias et al. Crowdsourced indoor localization for diverse devices through radiomap fusion
Zou et al. WinIPS: WiFi-based non-intrusive indoor positioning system with online radio map construction and adaptation
Yilmaz et al. Radio environment map as enabler for practical cognitive radio networks
Luo et al. Enhancing Wi-Fi fingerprinting for indoor positioning using human-centric collaborative feedback
EP2118810B1 (en) System and method for optimizing location estimate of mobile unit
US9020525B2 (en) Method and system for mobile reference signature generation
CN111867049B (en) Positioning method, positioning device and storage medium
CN105704657B (en) Monitor the method and device of mobile terminal locations
Ren et al. D-Log: A WiFi Log-based differential scheme for enhanced indoor localization with single RSSI source and infrequent sampling rate
Farkas et al. Optimization of Wi-Fi access point placement for indoor localization
CN104168650A (en) Indoor positioning method based on dynamic wireless access points
Lo et al. Adaptive radio maps for pattern-matching localization via inter-beacon co-calibration
Huang et al. A theoretical analysis on sampling size in WiFi fingerprint-based localization
CN107431995A (en) Realize the checking to the estimated location of mobile device
US9344907B1 (en) Analyzing wireless signal propagation
US20140171104A1 (en) Mobile Communication System
CN105635969A (en) Information pushing method and information pushing server
Bejarano-Luque et al. A data-driven algorithm for indoor/outdoor detection based on connection traces in a LTE network
Morales et al. Mitigating anomalous measurements for indoor wireless local area network positioning
Suchanski et al. Radio environment maps for military cognitive networks: construction techniques vs. map quality
CN103442432A (en) Fingerprint locating method and server
Zadgaonkar et al. Locating objects in warehouses using ble beacons & machine learning
Dong et al. Neural network based radio fingerprint similarity measure
Morales et al. Faulty measurements impact on wireless local area network positioning performance

Legal Events

Date Code Title Description
A201 Request for examination
E902 Notification of reason for refusal
E701 Decision to grant or registration of patent right
GRNT Written decision to grant
FPAY Annual fee payment

Payment date: 20161024

Year of fee payment: 4

FPAY Annual fee payment

Payment date: 20181022

Year of fee payment: 6