JP2015153189A - Statistical user behavior analyzer, method and program - Google Patents

Statistical user behavior analyzer, method and program Download PDF

Info

Publication number
JP2015153189A
JP2015153189A JP2014026892A JP2014026892A JP2015153189A JP 2015153189 A JP2015153189 A JP 2015153189A JP 2014026892 A JP2014026892 A JP 2014026892A JP 2014026892 A JP2014026892 A JP 2014026892A JP 2015153189 A JP2015153189 A JP 2015153189A
Authority
JP
Japan
Prior art keywords
data
measurement data
density
cells
user behavior
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP2014026892A
Other languages
Japanese (ja)
Other versions
JP6219743B2 (en
Inventor
川口 銀河
Ginga Kawaguchi
銀河 川口
石橋 圭介
Keisuke Ishibashi
圭介 石橋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2014026892A priority Critical patent/JP6219743B2/en
Publication of JP2015153189A publication Critical patent/JP2015153189A/en
Application granted granted Critical
Publication of JP6219743B2 publication Critical patent/JP6219743B2/en
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Telephonic Communication Services (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

PROBLEM TO BE SOLVED: To utilize distribution of measurement result made by an imbalanced user as an outcome corresponding to a behavior pattern of a general user.SOLUTION: The present invention acquires measurement data for designated items in an evaluation object area; normalizes the measurement data; acquires density data for the same items as those of the measurement data from density distribution data storage means for storing in advance density distribution data of user behavior; and corrects bias of the measurement data by weighting the normalized measurement data with the density data.

Description

本発明は、統計的ユーザ行動分析装置及び方法及びプログラムに係り、特に、多様性のあるモバイル通信において、広域で計測されたデータからユーザ行動を分析するための統計的ユーザ行動分析装置及び方法及びプログラムに関する。   The present invention relates to a statistical user behavior analysis apparatus, method, and program, and more particularly to a statistical user behavior analysis apparatus and method for analyzing user behavior from data measured in a wide area in diverse mobile communications, and Regarding the program.

近年、3G/LTE(Third Generation/Long Term Evolution)等のモバイル通信ネットワークの利用が増大するに従い、その通信品質の計測、評価、把握が課題となっている。   In recent years, as the use of mobile communication networks such as 3G / LTE (Third Generation / Long Term Evolution) increases, measurement, evaluation, and grasping of the communication quality have become issues.

モバイル通信はその多様性(時間、空間等による変化)ゆえに少数のサンプルを計測して、平均値等で品質実態を代表したとすることは難しい。   Because of the diversity of mobile communications (changes due to time, space, etc.), it is difficult to measure a small number of samples and represent the actual quality with average values.

そのため、場所ごと、時間ごとの計測結果という計測データが必要になる。当然ながら、あらゆる場所、時間での計測を行うことは専門の人員等により計測することになり、現実的にはコストの観点から困難である。   Therefore, measurement data called measurement results for each place and time is required. Naturally, it is difficult to measure at any place and time by a specialized person or the like, which is actually difficult from the viewpoint of cost.

そこで、モバイル通信の多様性に対して、ユーザ側の端末にインストールした計測アプリケーションによる計測行動を、サーバ側で集計したログを分析することで多様なユーザ行動をカバーした計測を行うというアプローチがある(例えば、非特許文献1参照)。   Therefore, there is an approach to measure the diversity of mobile communication by measuring the measurement behavior by the measurement application installed on the terminal on the user's side, and analyzing the logs aggregated on the server side to cover various user behaviors. (For example, see Non-Patent Document 1).

RBBTODAY、「ビッグデータで分析!iPhone 5s/5cでLTE勝負を制したのはau」[online]、2013年10月1日 19:00 http://www.rbbtoday.com/article/2013/10/01/112343.htmlRBBTODAY, “Analysis with Big Data! The au that won the LTE game with iPhone 5s / 5c” [online], 1 October 2013, 19:00 http://www.rbbtoday.com/article/2013/10 /01/112343.html

しかしながら、上記非特許文献1の方法では、個別利用者や端末単位での観点では問題にならないものの、ネットワーク全体の計測という観点では、アプリケーションをインストールしているユーザの行動次第であるため、いくつかの偏りがあるという問題がある。   However, although the method of Non-Patent Document 1 is not a problem from the viewpoint of individual users or terminals, it is dependent on the behavior of the user who has installed the application from the viewpoint of measuring the entire network. There is a problem that there is a bias.

更に、以下のような課題がある。   Furthermore, there are the following problems.

a.インストールユーザの母集団の属性の偏り:
一般ユーザに比べ、ある特殊なアプリケーションを好むヘビーユーザやマニア層に偏る。
a. Install user population attribute bias:
Compared to general users, they tend to be heavy users and enthusiasts who prefer certain special applications.

b.インストールユーザの異行動パターン(日時・場所)の偏り:
暇つぶしや娯楽的に計測を行うユーザがいるため、一般の利用者の通信利用の日時や場所とは分布が異なる。
b. Bias of different behavior patterns (date / time / location) of installation users:
Since there are users who measure time for killing time and entertainment, the distribution is different from the date and place of communication use of general users.

上記のa.b.のような偏りのため、ユーザ端末のアプリケーションによるモバイル通信ネットワークの計測結果を、一般利用者の利用品質に対応した計測して利用することは適さない。   A. b. Therefore, it is not suitable to measure and use the measurement result of the mobile communication network by the application of the user terminal corresponding to the use quality of general users.

また、計測結果のサンプルの偏りを正規化することは可能であるが、単純な正規化を行い、ユーザが多い地点や少ない地点を同等の重みで対等に扱うこともまた一般利用者の利用品質に対応した計測としては不適である。   In addition, it is possible to normalize the sample deviation of the measurement results, but it is also possible to perform simple normalization and treat points with a large number of users and points with a small number of users equally with equal weight. It is not suitable for measurement corresponding to.

本発明は、上記の点に鑑みなされたもので、偏ったユーザによる計測結果の分布を一般利用者の行動パターンに対応した結果として利用することが可能な統計的ユーザ行動分析装置及び方法及びプログラムを提供することを目的とする。   The present invention has been made in view of the above points, and a statistical user behavior analysis apparatus, method, and program capable of using a distribution of measurement results by biased users as a result corresponding to a general user's behavior pattern The purpose is to provide.

一態様によれば、広域で計測したデータを一般ユーザの行動データとして得るために計測データに重み付けする統計的ユーザ行動分析装置であって、
計測位置情報、計測値、時間、属性の全ての項目、またはいずれかの項目を含む計測データを取得し、正規化を行う計測データ抽出手段と、
予めユーザ行動の密度分布データを格納した密度分布データ記憶手段と、
前記密度分布データ記憶手段から、前記計測データ抽出手段で取得した計測データと同様の項目の密度データを取得する密度データ抽出手段と、
前記計測データ抽出手段で正規化された計測データについて、前記密度データを用いて重み付けする重み算出手段と、を有する統計的ユーザ行動分析装置が提供される。
According to one aspect, a statistical user behavior analysis device that weights measurement data to obtain data measured in a wide area as behavior data of a general user,
Measurement data extraction means for acquiring measurement data including measurement position information, measurement values, time, all items of attribute, or any item, and normalizing;
Density distribution data storage means for storing user action density distribution data in advance;
Density data extraction means for acquiring density data of the same items as the measurement data acquired by the measurement data extraction means from the density distribution data storage means;
There is provided a statistical user behavior analysis device comprising weight calculation means for weighting measurement data normalized by the measurement data extraction means using the density data.

一態様によれば、計測データを一旦、時間・空間上での正規化を行った上で、ユーザ行動等の密度分布データを用いて重みを求めることにより、当該重みを用いて偏りを補正することが可能となる。これにより、直接に「全ユーザの端末による計測」が実現できなくても、全ユーザの利用行動に沿った場面での品質分布について、全ユーザの行動と精緻に対応させて計画的に計測試験を実施した非常に高コストのデータを用いなくとも、低コストで得られるユーザによる自主測定の集計データから適切に推定することが可能となる。   According to one aspect, the measurement data is once normalized in time and space, and the weight is obtained using density distribution data such as user behavior, thereby correcting the bias using the weight. It becomes possible. As a result, even if “measurement by all users' terminals” cannot be realized directly, the quality distribution in the scene according to the usage behaviors of all users is measured systematically in correspondence with the behaviors of all users. Even without using the very high-cost data that has been implemented, it is possible to appropriately estimate from the total data of the self-measurement by the user obtained at a low cost.

本発明の一実施の形態における統計的ユーザ行動分析装置の構成例である。It is an example of composition of a statistical user action analysis device in one embodiment of the present invention. 本発明の一実施の形態における処理概要のフローチャートである。It is a flowchart of the process outline | summary in one embodiment of this invention.

以下、図面と共に本発明の実施の形態を説明する。   Hereinafter, embodiments of the present invention will be described with reference to the drawings.

図1は、本発明の一実施の形態における統計的ユーザ行動分析装置の構成例を示す。   FIG. 1 shows a configuration example of a statistical user behavior analysis apparatus according to an embodiment of the present invention.

同図に示す統計的ユーザ行動分析装置100は、密度分布データ記憶部110、計測データ抽出部120、密度データ抽出部130、重み平均算出部140、出力部150を有し、計測データ抽出部120は、外部の計測データDB10と接続されている。   The statistical user behavior analysis apparatus 100 shown in the figure includes a density distribution data storage unit 110, a measurement data extraction unit 120, a density data extraction unit 130, a weighted average calculation unit 140, and an output unit 150. The measurement data extraction unit 120 Are connected to an external measurement data DB 10.

なお、統計的ユーザ行動分析装置100は、上記の構成以外に、計算結果等を一時的に保持するメモリ等の記憶手段を有するものとする。   In addition to the above configuration, the statistical user behavior analysis apparatus 100 includes storage means such as a memory that temporarily holds calculation results and the like.

計測データDB10は、計測データMとして、表1に示すような、計測値、緯度、経度、標高、時刻、年代、性別等を保持する。なお、表1の例に限定されることなく、計測データは任意に設定可能である。   The measurement data DB 10 holds, as measurement data M, measurement values, latitudes, longitudes, altitudes, times, ages, genders, and the like as shown in Table 1. Note that the measurement data is not limited to the example in Table 1 and can be arbitrarily set.

Figure 2015153189
表1の各計測値、緯度・経度等の位置情報、属性等は単に時系列に記録されており、属性毎のように分類されているものではない。また、計測値はスループット値、遅延値、損失率等なんでもよい。実際の計測データでは、複数の計測値が含まれるが、ここでは説明の簡単化のため、1種類の計測値のみを扱うものとする。
Figure 2015153189
Each measured value in Table 1, position information such as latitude and longitude, attributes, and the like are simply recorded in time series, and are not classified as per attribute. The measured value may be anything such as a throughput value, a delay value, a loss rate, and the like. Although actual measurement data includes a plurality of measurement values, only one type of measurement value is handled here for simplicity of explanation.

密度分布データ記憶部110は、予め生成され、ユーザ密度データDとして、表2に示すような、密度、緯度、経度、標高、時間帯、年代、性別、その他等を保持する。   The density distribution data storage unit 110 is generated in advance and holds, as user density data D, density, latitude, longitude, altitude, time zone, age, sex, etc. as shown in Table 2.

Figure 2015153189
表2において、緯度、経度、標高は、予め決められた値(後述の評価対象エリア座標にある「座標位置」に対応する値)とする。座標、年代、性別共に繰り返し現れるが、全ての属性が共通なレコードは含まれない(同じ座標で、年代が異なるもの、性別が異なるもの等は含まれる)。
Figure 2015153189
In Table 2, latitude, longitude, and altitude are values determined in advance (values corresponding to “coordinate positions” in evaluation target area coordinates described later). Coordinates, age, and gender appear repeatedly, but records that share all attributes are not included (those that have the same coordinates but have different ages, different genders, etc.).

性別は仮に、「0」は男性、「1」は女性の2値とする。時間帯は、例えば、tz1では、tz1s(開始時刻)からtz1e(終了時刻)までの時間区間を示す。また、評価対象エリア座標セットKの座標のデータが全部含まれるとは限らず、欠損データとなることがある。これは、例えば、10×10の100セルのメッシュがあった場合に、全部のセルにデータがあるわけではなく、全くデータが含まれないセルが存在する可能性がある。同様に、年代、性別も全て網羅しているとは限らない。 For example, “0” is male and “1” is female. For example, in tz 1 , the time zone indicates a time interval from tz 1s (start time) to tz 1e (end time). Further, not all the coordinate data of the evaluation target area coordinate set K are included, and there may be missing data. For example, if there is a 10 × 10 100-cell mesh, not all cells have data, and there may be cells that do not contain any data. Similarly, not all ages and genders are covered.

計測データDB10の年代yz1,yz2,…等は年代別のラベルを示しており、例えば、
Z1:Z1未満
Z2:Z1以上、Z2未満
Z3:…
と定義する。ここで、Z1,Z2,Z3,…は各年代の切れ目を示す年齢値であり、Z1=20,Z2=35,Z3=50等である。
The ages yz 1 , yz 2 , etc. in the measurement data DB 10 indicate labels according to the ages, for example,
Z1: Less than Z 1
Z2: Z 1 or more, less than Z2
Z3: ...
It is defined as Here, Z 1 , Z 2 , Z 3 ,... Are age values indicating the breaks of each age, such as Z 1 = 20, Z 2 = 35, and Z 3 = 50.

また、計測データDB10の計測データMの識別対象エリア座標セットを、
K={(Lat1,Lon1,Alt1),(Lat2,Lon2,Alt2),…,(Latk,Lonk,Altk)}
とする。上記のKは評価対象エリア内をメッシュに区切り、区切られた各単位(セル)のi(i=1,2,…K)番目の緯度(Lat)、経度(Lon)、標高(Alt)の西南下端の位置を示す。各セルの大きさは緯度、経度、標高方向にそれぞれ、dlat,dlon,daltとする。即ち、1番目のセルの範囲は以下の通りとする。
Also, the identification target area coordinate set of the measurement data M in the measurement data DB 10 is
K = {(Lat 1 , Lon 1 , Alt 1 ), (Lat 2 , Lon 2 , Alt 2 ),…, (Lat k , Lon k , Alt k )}
And K above is the mesh of the evaluation area, and the i (i = 1,2, ... K) th latitude (Lat), longitude (Lon), altitude (Alt) of each divided unit (cell) Indicates the position of the southwest bottom. The size of each cell is dl at , d lon , and d alt in the latitude, longitude, and elevation directions, respectively. That is, the range of the first cell is as follows.

緯度:Lat1以上Lat1+dlat未満
経度:Lon1以上Lon1+dlon未満
標高:Alt1以上Alt1+dalt未満
実際には、緯度、経度のみの2次元データでもよい。その場合、標高データは全部0等のダミーデータとする。
Latitude: Lat 1 or more and less than Lat 1 + d lat Longitude: Lon 1 or more and less than Lon 1 + d lon Altitude: Alt 1 or more and less than Alt 1 + d alt Actually, two-dimensional data of only latitude and longitude may be used. In that case, the altitude data is all dummy data such as zero.

重み平均算出部140では、サンプルの処理関数fとして、平均を用いる。例として、k個のデータの平均の場合の処理関数(平均処理関数f)は、以下の通りである。   The weighted average calculation unit 140 uses an average as the sample processing function f. As an example, the processing function (average processing function f) in the case of the average of k data is as follows.

f(x1,x2,x3,…,xk)=(x1+x2+x3+…+xk)/k
本実施の形態では、上記の前提の下、
(1)場所のみに着目した重み付け処理;
(2)性別、年代別での重み付け処理;
(3)場所、年代、性別での重み付け処理
を行う。
f (x1, x2, x3,…, xk) = (x1 + x2 + x3 +… + xk) / k
In the present embodiment, under the above assumption,
(1) Weighting process focusing on location only;
(2) Weighting process by gender and age group;
(3) Perform weighting processing by location, age, and gender.

図2は、本発明の一実施の形態における処理概要のフローチャートである。   FIG. 2 is a flowchart of an outline of processing in one embodiment of the present invention.

同図に示す処理概要の手順は上記の(1)、(2)、(3)共に同じである。   The procedure of the outline of processing shown in the figure is the same for the above (1), (2), and (3).

ステップ101) ユーザは、評価対象エリアと上記の(1)(2)(3)のうちのいずれの処理を行うかを決定すると、ユーザインタフェース部101を介して入力する。 ステップ102)i=1とする。   Step 101) When the user determines which of the evaluation target area and the above (1), (2), and (3) is to be performed, the user inputs via the user interface unit 101. Step 102) i = 1.

ステップ103)密度データ抽出部130は、密度分布データ記憶部110から評価対象エリアの処理対象種別に対応するi番目のセルの密度データDを抽出し、その和を求める。   Step 103) The density data extraction unit 130 extracts the density data D of the i-th cell corresponding to the processing target type of the evaluation target area from the density distribution data storage unit 110, and obtains the sum thereof.

ステップ104)i>Kであればステップ106に移行し、i≦Kであればステップ105に移行する。   Step 104) If i> K, go to Step 106, and if i ≦ K, go to Step 105.

ステップ105)i=i+1としてステップ103に戻る。   Step 105) Set i = i + 1 and return to Step 103.

ステップ106)i=1とする。   Step 106) i = 1.

ステップ107)計測データ抽出部120は、計測データDB10からステップ103と同様に、評価対象エリアの処理種別に対応するi番目のセルの計測データMを抽出し、統計処理を行う。   Step 107) The measurement data extraction unit 120 extracts the measurement data M of the i-th cell corresponding to the processing type of the evaluation target area from the measurement data DB 10 in the same manner as Step 103, and performs statistical processing.

ステップ108)i>Kであればステップ110に移行し、i≦Kであればステップ109に移行する。   Step 108) If i> K, go to Step 110, and if i ≦ K, go to Step 109.

ステップ109)i=i+1とし、ステップ107に戻る。   Step 109) i = i + 1 and return to Step 107.

ステップ110)重み算出部140は、ステップ103で得られたセル毎の密度データDの和と、ステップ107で得られた統計処理が行われたセル毎の計測データを取得して、対象エリアのセルの重み付け平均を算出する。   Step 110) The weight calculation unit 140 obtains the sum of the density data D for each cell obtained in Step 103 and the measurement data for each cell on which the statistical processing obtained in Step 107 is performed. Calculate the weighted average of the cells.

ステップ111) 出力部150は、得られた重み付け平均を計測結果として出力する。   Step 111) The output unit 150 outputs the obtained weighted average as a measurement result.

以下に、上記(1)、(2)、(3)のそれぞれの処理について詳細に説明する。   Below, each process of said (1), (2), (3) is demonstrated in detail.

(1)場所のみに着目した重み付け処理:
当該処理は、場所のみのユーザ密度での重み付けを行うものである。
(1) Weighting process focusing on location only:
This process performs weighting with the user density of only the place.

ここでは、評価対象エリアのセル単位での処理であり、処理セル別の密度を算出する。データ数は全k個とする。評価対象となる計測データMの座標セットは、
K={(Lat1,Lon1,Alt1),(Lat2,Lon2,Alt2),…,(Latk,Lonk,Altk)}
とする。
Here, the processing is performed in units of cells in the evaluation target area, and the density for each processing cell is calculated. The total number of data is k. The coordinate set of measurement data M to be evaluated is
K = {(Lat 1 , Lon 1 , Alt 1 ), (Lat 2 , Lon 2 , Alt 2 ),…, (Lat k , Lon k , Alt k )}
And

なお、評価対象エリアを限定する場合と全エリアを対象とする場合がある。以下の例では対象エリアをセル番号2,3,5で構成される場合を示す。   There are cases where the evaluation target area is limited and all areas are targeted. The following example shows a case where the target area is composed of cell numbers 2, 3, and 5.

<i番目のセルについて密度データ抽出>
前述のステップ103の処理は以下の通りである。
<Density data extraction for i-th cell>
The processing in step 103 described above is as follows.

密度データ抽出部130は、密度分布データ記憶部110から、
経度:「Lati以上&&Lati+dlat未満」
かつ、
経度:「Loni以上&&Loni+dlon未満」
かつ、
標高:「Alti以上&&Alti+dalt未満」
の密度データDを抽出し、その和を求める。
The density data extraction unit 130 receives from the density distribution data storage unit 110.
Longitude: "Lat i or higher && Lat i + d lat lower "
And,
Longitude: “Lon i or higher && less than Lon i + d lon
And,
Elevation: "Alt i or higher && Alt i + d alt less"
The density data D is extracted and the sum is obtained.

検索結果(px,py,…)であるときのi番目のセルの密度の和は、
Di=Σ(px,py,…)
となる。なお、検出結果が0件の場合は、Di=0とする。
The sum of the densities of the i-th cell in the search result (p x , p y , ...) is
Di = Σ (p x , p y ,…)
It becomes. If the detection result is 0, D i = 0.

上記の処理を全セルに対して繰り返し、密度ベクトル
Dv=(D1,D2,…Dk)
を生成し、メモリ(図示せず)に格納する。
Repeat the above process for all cells, and the density vector
Dv = (D 1 , D 2 ,… D k )
Is generated and stored in a memory (not shown).

<i番目のセルの計測データ抽出>
上記のステップ107の処理は以下の通りである。
<Measurement data extraction of i-th cell>
The processing in step 107 is as follows.

計測データ抽出部120は、計測データDB10から
経度:「Lati以上&&Lati+dlat未満」
かつ、
経度:「Loni以上&&Loni+dlon未満」
かつ、
標高:「Alti以上&&Alti+dalt未満」
の計測データMを抽出し、その統計処理(平均処理関数fを適用する)を行う。
The measurement data extraction unit 120 obtains the longitude: “Lat i or more && Lat i + d lat ” or less from the measurement data DB 10.
And,
Longitude: “Lon i or higher && less than Lon i + d lon
And,
Elevation: "Alt i or higher && Alt i + d alt less"
The measurement data M is extracted and its statistical processing (the average processing function f is applied) is performed.

検索結果(ri,rj,…)であるときのi番目のセルの平均値は
rmeani=f(ri,rj,…)
となる。なお、検出結果が0件の場合は、rmeani=0とする。
The average value of the i-th cell in the search result (r i , r j ,…) is
rmean i = f (r i , r j ,…)
It becomes. If the detection result is 0, rmean i = 0.

上記の処理を全セルに対して繰り返し、計測ベクトル
Rv=(rmean1,rmean2,…,rmeank)
を生成し、メモリ(図示せず)に格納する。
Repeat the above process for all cells and measure
Rv = (rmean 1 , rmean 2 ,…, rmean k )
Is generated and stored in a memory (not shown).

<算出したいエリアの重み付け平均を算出>
以下では、例として評価対象エリアがセル番号2,3,5で構成されているものとする。
<Calculate the weighted average of the area you want to calculate>
In the following, it is assumed that the evaluation target area is composed of cell numbers 2, 3, and 5 as an example.

重み算出部140は、密度ベクトル(Dv)と計測ベクトル(Rv)を用いて、平均を
平均=(D2*rmean2+D3*rmean3+D5*rmean5)/(D2 + D3 +D5)
により求める。
The weight calculation unit 140 uses the density vector (Dv) and the measurement vector (Rv) to calculate the average = (D 2 * rmean 2 + D 3 * rmean 3 + D 5 * rmean 5 ) / (D 2 + D 3 + D 5 )
Ask for.

また、算出したいエリアが全エリアである場合、全エリアの重み付け平均(Σ(Dv*Rv)/ΣDv)を、
Σ(Dv*Rv)/ΣDv=(D1*rmen1+D2*rmean2+…+Dk*rmeank)/(D1+D2+…+Dk)
により求める。
If the area you want to calculate is all areas, the weighted average of all areas (Σ (Dv * Rv) / ΣDv)
Σ (Dv * Rv) / ΣDv = (D 1 * rmen 1 + D 2 * rmean 2 +… + D k * rmean k ) / (D 1 + D 2 +… + D k )
Ask for.

ステップ111において、出力部150は、重み付け平均を計測結果として出力する。   In step 111, the output unit 150 outputs the weighted average as a measurement result.

(2)場所と時間帯でのユーザ密度の重み付け処理:
次に、位置情報に加えて時間帯別での重み処理の例を説明する。
(2) User density weighting process in place and time zone:
Next, an example of weight processing for each time zone in addition to position information will be described.

図2のステップ101において、利用者が抽出する場所及び時間帯を選択する。ここでは、時間帯の例として、tz3とする。場所については上記の(1)と同様である。 In step 101 of FIG. 2, the place and time zone to be extracted by the user are selected. Here, tz 3 is assumed as an example of the time zone. The location is the same as (1) above.

<i番目のセルについて密度データを抽出>
図2のステップ103の処理は以下の通りである。
<Extract density data for i-th cell>
The processing in step 103 in FIG. 2 is as follows.

密度データ抽出部130は、密度分布データ記憶部110から
経度:「Lati以上&&Lati+dlat未満」
かつ、
経度:「Loni以上&&Loni+dlon未満」
かつ、
標高:「Alti以上&&Alti+dalt未満」
かつ、
時間帯:tz3
のデータを検索し、抽出し、その和を求める。
The density data extraction unit 130 receives the longitude: “Lat i or more && Lat i + d lat ” from the density distribution data storage unit 110.
And,
Longitude: “Lon i or higher && less than Lon i + d lon
And,
Elevation: "Alt i or higher && Alt i + d alt less"
And,
Time zone: tz 3
Search and extract the data of, and find the sum.

抽出結果が(px,py,… )であるときのi番目のセルの密度和は
D i=Σ(px,py,…)
である。なお、抽出結果が0件の場合は、Di=0とする。
When the extraction result is (p x , p y ,…), the density sum of the i-th cell is
D i = Σ (p x , p y ,…)
It is. If the extraction result is 0, Di = 0.

上記の処理を全セルについて繰り返し、密度ベクトル
Dv=(D1,D2,…,Dk)
を生成し、メモリ(図示せず)に格納する。
Repeat the above process for all cells, and the density vector
Dv = (D 1 , D 2 ,…, D k )
Is generated and stored in a memory (not shown).

<i番目のセルの計測データを抽出>
図2のステップ107の処理は以下の通りである。
<Extract measurement data of i-th cell>
The processing in step 107 in FIG. 2 is as follows.

計測データ抽出部120は、計測データDB10から、
経度:「Lati以上&&Lati+dlat未満」
かつ、
経度:「Loni以上&&Loni+dlon未満」
かつ、
標高:「Alti以上&&Alti+dalt未満」
かつ、
時刻情報:(tz3s(tz3開始時刻)以上&& tz3e(tz3終了時刻)
の計測データMを検索し、抽出する。
The measurement data extraction unit 120 reads from the measurement data DB 10
Longitude: "Lat i or higher && Lat i + d lat lower "
And,
Longitude: “Lon i or higher && less than Lon i + d lon
And,
Elevation: "Alt i or higher && Alt i + d alt less"
And,
Time information: (tz 3s (tz 3 start time) or more && tz 3e (tz 3 end time)
Search and extract the measurement data M.

その統計処理(今回の処理では平均処理関数fを適用)する。   The statistical processing (the average processing function f is applied in this processing).

抽出結果が(ri,rj,…)であるときのi番目のセルの平均値は
rmeani=f(ri,rj,…)
である。なお、抽出結果が0件の場合は、rmeani=0とする。
When the extraction result is (r i , r j ,…), the average value of the i-th cell is
rmean i = f (r i , r j ,…)
It is. If the extraction result is 0, rmean i = 0.

上記の処理を全セルについて繰り返し、計測ベクトル
Rv=(rmean1,rmean2,…,rmeank)
を生成し、メモリ(図示せず)に格納する。
Repeat the above process for all cells and measure
Rv = (rmean 1 , rmean 2 ,…, rmean k )
Is generated and stored in a memory (not shown).

<算出したいエリアの重み付け平均を算出>
図2のステップ110の処理は以下の通りである。
<Calculate the weighted average of the area you want to calculate>
The processing of step 110 in FIG. 2 is as follows.

ここでは、例として、評価対象エリアがセル番号2,3,5で構成されているものとする。   Here, as an example, it is assumed that the evaluation target area includes cell numbers 2, 3, and 5.

重み算出部140は、時間帯tz3で載せる2,3,5での平均を、
平均=(D2*rmean2+D3*rmean3+D5*rmean5)/(D2+D3+D5)
により求める。
The weight calculation unit 140 calculates the average of 2, 3 , and 5 placed in the time zone tz 3
Average = (D 2 * rmean 2 + D 3 * rmean 3 + D 5 * rmean 5 ) / (D 2 + D 3 + D 5 )
Ask for.

また、算出したい評価対象エリアと全エリアが同じ場合、すなわち、時間帯tz3における前エリアの重み付け平均Σ(Dv*Rv)/ΣDvは、
Σ(Dv*Rv)/ΣDv=(D1*rmen1+D2*rmean2+…+Dk*rmeank)/D1+D2+…+Dk)
により求められる。
Also, if the evaluation target area to be calculated and all areas are the same, that is, the weighted average Σ (Dv * Rv) / ΣDv of the previous area in the time zone tz3 is
Σ (Dv * Rv) / ΣDv = (D 1 * rmen 1 + D 2 * rmean 2 +… + D k * rmean k ) / D 1 + D 2 +… + D k )
Is required.

ステップ111において、出力部150は、重み付け平均を計測結果として出力する。   In step 111, the output unit 150 outputs the weighted average as a measurement result.

(3)場所、年代、性別でのユーザ密度の重み付け処理:
当該処理は、場所単位に加えて、年代や性別についても重み付けの際に考慮する場合を示す。
(3) User density weighting process by location, age, and gender:
This processing shows a case where age and gender are taken into consideration in weighting in addition to the location unit.

図2のステップ101において、処理対象の場所、年代、性別を決定する。ここでは、抽出対象年代をZjとする。つまり、計測対象者の年齢がZj-1以上、Zj未満である。性別は"0"(男性)とする。場所については上記の(1)と同様である。 In step 101 of FIG. 2, the location, age, and sex to be processed are determined. Here, the extraction target age is assumed to be Zj. That is, the age of the measurement subject is Z j−1 or more and less than Z j . The gender is “0” (male). The location is the same as (1) above.

<i番目のセルについて密度データ抽出>
ステップ103において、密度データ抽出部130は、密度分布データ記憶部110から、
経度:「Lati以上&&Lati+dlat未満」
かつ、
経度:「Loni以上&&Loni+dlon未満」
かつ、
標高:「Alti以上&&Alti+dalt未満」
かつ
年代:Zj
かつ
性別:0
の密度データDを検索、抽出し、その和を求める。
<Density data extraction for i-th cell>
In step 103, the density data extraction unit 130 reads from the density distribution data storage unit 110.
Longitude: "Lat i or higher && Lat i + d lat lower "
And,
Longitude: “Lon i or higher && less than Lon i + d lon
And,
Elevation: "Alt i or higher && Alt i + d alt less"
And Age: Zj
And gender: 0
The density data D is searched and extracted, and the sum is obtained.

抽出結果が(px,py,… )であるときのi番目のセルの密度和は
D i=Σ(px,py,…)
である。なお、抽出結果が0件の場合は、Di=0とする。
When the extraction result is (p x , p y ,…), the density sum of the i-th cell is
D i = Σ (p x , p y ,…)
It is. If the extraction result is 0, Di = 0.

上記の処理を全セルについて繰り返し、密度ベクトル
Dv=(D1,D2,…,Dk)
を生成し、メモリ(図示せず)に格納する。
Repeat the above process for all cells, and the density vector
Dv = (D 1 , D 2 ,…, D k )
Is generated and stored in a memory (not shown).

<i番目のセルの計測データ抽出>
図2のステップ107の処理は以下の通りである。
<Measurement data extraction of i-th cell>
The processing in step 107 in FIG. 2 is as follows.

計測データ抽出部120は、計測データDB10から、
経度:「Lati以上&&Lati+dlat未満」
かつ、
経度:「Loni以上&&Loni+dlon未満」
かつ、
標高:「Alti以上&&Alti+dalt未満」
かつ、
年代:Zj
かつ
性別:0
の計測データMを検索し、抽出する。
The measurement data extraction unit 120 reads from the measurement data DB 10
Longitude: "Lat i or higher && Lat i + d lat lower "
And,
Longitude: “Lon i or higher && less than Lon i + d lon
And,
Elevation: "Alt i or higher && Alt i + d alt less"
And,
Age: Zj
And gender: 0
Search and extract the measurement data M.

その統計処理(今回の処理では平均処理関数fを適用)する。   The statistical processing (the average processing function f is applied in this processing).

抽出結果が(ri,rj,…)であるときのi番目のセルの平均値は
rmeani=f(ri,rj,…)
である。なお、抽出結果が0件の場合は、rmeani=0とする。
When the extraction result is (r i , r j ,…), the average value of the i-th cell is
rmean i = f (r i , r j ,…)
It is. If the extraction result is 0, rmean i = 0.

上記の処理を全セルについて繰り返し、計測ベクトル
Rv=(rmean1,rmean2,…,rmeank)
を生成し、メモリ(図示せず)に格納する。
Repeat the above process for all cells and measure
Rv = (rmean 1 , rmean 2 ,…, rmean k )
Is generated and stored in a memory (not shown).

<算出したいエリアの重み付け平均を算出>
図2のステップ110の処理は以下の通りである。
<Calculate the weighted average of the area you want to calculate>
The processing of step 110 in FIG. 2 is as follows.

ここでは、例として、評価対象エリアがセル番号2,3,5で構成されているものとする。   Here, as an example, it is assumed that the evaluation target area includes cell numbers 2, 3, and 5.

重み平均算出部140は、時間帯tz3でセル2,3,5での平均を、
平均=(D2*rmean2+D3*rmean3+D5*rmean5)/(D2+D3+D5)
により求める。
The weighted average calculation unit 140 calculates the average of the cells 2, 3 , and 5 in the time zone tz3.
Average = (D 2 * rmean 2 + D 3 * rmean 3 + D 5 * rmean 5 ) / (D 2 + D 3 + D 5 )
Ask for.

また、算出したい評価対象エリアと全エリアが同じ場合、すなわち、時間帯tz3における前エリアの重み付け平均Σ(Dv*Rv)/ΣDvは、
Σ(Dv*Rv)/ΣDv=(D1*rmean1+D2*rmean2+…+Dk*rmeank)/(D1+D2+…+Dk)
により求められる。
Also, if the evaluation target area to be calculated and all areas are the same, that is, the weighted average Σ (Dv * Rv) / ΣDv of the previous area in the time zone tz3 is
Σ (Dv * Rv) / ΣDv = (D 1 * rmean 1 + D 2 * rmean 2 +… + D k * rmean k ) / (D 1 + D 2 +… + D k )
Is required.

ステップ111において、出力部150は、重み付け平均を計測結果として出力する。   In step 111, the output unit 150 outputs the weighted average as a measurement result.

なお、上記の図1に示す統計的ユーザ行動分析装置100の各構成要素の動作をプログラムとして構築し、統計的ユーザ行動分析装置として利用されるコンピュータにインストールして実行させる、または、ネットワークを介して流通させることが可能である。   The operation of each component of the statistical user behavior analysis apparatus 100 shown in FIG. 1 is constructed as a program and installed in a computer used as the statistical user behavior analysis apparatus, or executed via a network. Can be distributed.

本発明は、上記の実施の形態に限定されることなく、特許請求の範囲内において、種々変更・応用が可能である。   The present invention is not limited to the above-described embodiments, and various modifications and applications are possible within the scope of the claims.

10 計測データDB
100 統計的ユーザ行動分析装置
101 ユーザインタフェース部
110 密度分布データ記憶部
120 計測データ抽出部
130 密度データ抽出部
140 重み平均算出部
150 出力部
10 Measurement data DB
100 Statistical User Behavior Analysis Device 101 User Interface Unit 110 Density Distribution Data Storage Unit 120 Measurement Data Extraction Unit 130 Density Data Extraction Unit 140 Weighted Average Calculation Unit 150 Output Unit

Claims (7)

広域で計測したデータを一般ユーザの行動データとして得るために計測データに重み付けする統計的ユーザ行動分析装置であって、
ある評価対象エリアにおける指定された項目の計測データを取得し、正規化を行う計測データ抽出手段と、
予めユーザ行動の密度分布データを格納した密度分布データ記憶手段と、
前記密度分布データ記憶手段から、前記計測データ抽出手段で取得した計測データと同様の項目の密度データを取得する密度データ抽出手段と、
前記計測データ抽出手段で正規化された計測データについて、前記密度データを用いて重み付けする重み平均算出手段と、
を有することを特徴とする統計的ユーザ行動分析装置。
A statistical user behavior analysis device that weights measurement data to obtain data measured in a wide area as behavior data of general users,
A measurement data extraction means for acquiring measurement data of a specified item in a certain evaluation target area and performing normalization;
Density distribution data storage means for storing user action density distribution data in advance;
Density data extraction means for acquiring density data of the same items as the measurement data acquired by the measurement data extraction means from the density distribution data storage means;
For the measurement data normalized by the measurement data extraction means, weighted average calculation means for weighting using the density data;
A statistical user behavior analysis apparatus characterized by comprising:
前記計測データ抽出手段は、
前記評価対象エリアをメッシュに区切り、区切った単位(以下、「セル」と記す)の項目に対応する計測データを取得し、該計測データに対して、平均処理関数を用いて正規化し、全セルの平均値(Rv)を求める手段を含み、
前記密度データ抽出手段は、
前記計測データの前記セルに対応する項目の前記密度データを取得し、全セルの密度データの和を計算する手段を含み、
前記重み平均算出手段は、
前記全セルの平均値(Rv)と全セルの前記密度データの和(Dv)から全てのエリアの重み付け平均を算出する手段を含む
請求項1記載の統計的ユーザ行動分析装置。
The measurement data extraction means includes
The evaluation target area is divided into meshes, measurement data corresponding to items of the divided units (hereinafter referred to as “cells”) is obtained, normalized to the measurement data using an average processing function, and all cells Including means for obtaining an average value (Rv) of
The density data extracting means includes
Means for obtaining the density data of items corresponding to the cells of the measurement data and calculating a sum of density data of all cells;
The weighted average calculating means includes
The statistical user behavior analysis apparatus according to claim 1, further comprising means for calculating a weighted average of all areas from an average value (Rv) of all cells and a sum (Dv) of the density data of all cells.
前記計測データ抽出手段及び前記密度データ抽出手段は、
指定された評価対象の項目に基づいて、位置情報のみ、位置情報と時間帯組み合わせ、または、位置情報と任意の属性情報の組み合わせのいずれかの前記計測データ及び前記密度データを取得する手段を含む
請求項1または2記載の統計的ユーザ行動分析装置。
The measurement data extraction means and the density data extraction means are:
Based on a designated item to be evaluated, includes means for acquiring the measurement data and the density data of only position information, a combination of position information and time zone, or a combination of position information and arbitrary attribute information The statistical user behavior analysis apparatus according to claim 1 or 2.
広域で計測したデータを一般ユーザの行動データとして得るために計測データに重み付けする統計的ユーザ行動分析方法であって、
評価対象エリアにおける指定された項目の計測データを取得し正規化を行う計測データ抽出ステップと、
予めユーザ行動の密度分布データを格納した密度分布データ記憶手段から、前記計測データ抽出ステップで取得した計測データと同様の項目の密度データを取得する密度データ抽出ステップと、
前記計測データ抽出ステップで正規化された計測データについて、前記密度データを用いて重み付けする重み算出ステップと、
を行うことを特徴とする統計的ユーザ行動分析方法。
A statistical user behavior analysis method that weights measurement data to obtain data measured in a wide area as behavior data of general users,
A measurement data extraction step for obtaining and normalizing measurement data of a specified item in the evaluation target area;
A density data extraction step for acquiring density data of the same items as the measurement data acquired in the measurement data extraction step from the density distribution data storage means that stores the density distribution data of the user behavior in advance;
For the measurement data normalized in the measurement data extraction step, a weight calculation step for weighting using the density data;
Statistical user behavior analysis method characterized by performing.
前記計測データ抽出ステップにおいて、
前記評価対象エリアをメッシュに区切り、区切った単位(以下、「セル」と記す)の項目に対応する計測データを取得し、該計測データに対して、平均処理関数を用いて正規化し、全セルの平均値(Rv)を求め、
前記密度データ抽出ステップにおいて、
前記計測データの前記セルに対応する項目の前記密度データを取得し、全セルの密度データの和を計算し、
前記重み算出ステップにおいて、
前記全セルの平均値(Rv)と全セルの前記密度データの和(Dv)から全てのエリアの重み付け平均を算出する
請求項4記載の統計的ユーザ行動分析方法。
In the measurement data extraction step,
The evaluation target area is divided into meshes, measurement data corresponding to items of the divided units (hereinafter referred to as “cells”) is obtained, normalized to the measurement data using an average processing function, and all cells The average value (Rv) of
In the density data extraction step,
Obtaining the density data of items corresponding to the cells of the measurement data, calculating the sum of the density data of all cells,
In the weight calculation step,
The statistical user behavior analysis method according to claim 4, wherein a weighted average of all areas is calculated from an average value (Rv) of all cells and a sum (Dv) of the density data of all cells.
前記計測データ抽出ステップ及び前記密度データ抽出ステップにおいて、
指定された評価対象の項目に基づいて、位置情報のみ、位置情報と時間帯組み合わせ、または、位置情報と任意の属性情報の組み合わせのいずれかの前記計測データ及び前記密度データを取得する
請求項4または5記載の統計的ユーザ行動分析方法。
In the measurement data extraction step and the density data extraction step,
5. The measurement data and the density data of only position information, a combination of position information and time zone, or a combination of position information and arbitrary attribute information are acquired based on a specified evaluation target item. Or the statistical user behavior analysis method according to 5.
コンピュータを、
請求項1乃至3のいずれか1項に記載の統計的ユーザ行動分析装置の各手段として機能させるための統計的ユーザ行動分析プログラム。
Computer
The statistical user behavior analysis program for functioning as each means of the statistical user behavior analysis device according to any one of claims 1 to 3.
JP2014026892A 2014-02-14 2014-02-14 Quality data totaling and analyzing apparatus, method and program Expired - Fee Related JP6219743B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2014026892A JP6219743B2 (en) 2014-02-14 2014-02-14 Quality data totaling and analyzing apparatus, method and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2014026892A JP6219743B2 (en) 2014-02-14 2014-02-14 Quality data totaling and analyzing apparatus, method and program

Publications (2)

Publication Number Publication Date
JP2015153189A true JP2015153189A (en) 2015-08-24
JP6219743B2 JP6219743B2 (en) 2017-10-25

Family

ID=53895346

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2014026892A Expired - Fee Related JP6219743B2 (en) 2014-02-14 2014-02-14 Quality data totaling and analyzing apparatus, method and program

Country Status (1)

Country Link
JP (1) JP6219743B2 (en)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020502708A (en) * 2016-12-08 2020-01-23 アップ アニー インコーポレイテッド Determining mobile application usage data for a population

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003249887A (en) * 2002-02-22 2003-09-05 Sony Ericsson Mobilecommunications Japan Inc Communication quality level control system and history information storage device
JP2007096668A (en) * 2005-09-28 2007-04-12 Nippon Telegr & Teleph Corp <Ntt> Information management device, information management method, and information management program
WO2011055601A1 (en) * 2009-11-04 2011-05-12 株式会社エヌ・ティ・ティ・ドコモ Information analysis device and information analysis method
WO2011162415A1 (en) * 2010-06-24 2011-12-29 日本電気株式会社 Information providing apparatus, system, method, and program
JP2014002672A (en) * 2012-06-20 2014-01-09 Zenrin Datacom Co Ltd Information processing system, information processing method, and program

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2003249887A (en) * 2002-02-22 2003-09-05 Sony Ericsson Mobilecommunications Japan Inc Communication quality level control system and history information storage device
JP2007096668A (en) * 2005-09-28 2007-04-12 Nippon Telegr & Teleph Corp <Ntt> Information management device, information management method, and information management program
WO2011055601A1 (en) * 2009-11-04 2011-05-12 株式会社エヌ・ティ・ティ・ドコモ Information analysis device and information analysis method
WO2011162415A1 (en) * 2010-06-24 2011-12-29 日本電気株式会社 Information providing apparatus, system, method, and program
JP2014002672A (en) * 2012-06-20 2014-01-09 Zenrin Datacom Co Ltd Information processing system, information processing method, and program

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2020502708A (en) * 2016-12-08 2020-01-23 アップ アニー インコーポレイテッド Determining mobile application usage data for a population

Also Published As

Publication number Publication date
JP6219743B2 (en) 2017-10-25

Similar Documents

Publication Publication Date Title
CN105608179B (en) The method and apparatus for determining the relevance of user identifier
Diniz‐Filho et al. On the selection of phylogenetic eigenvectors for ecological analyses
Harte et al. Maximum entropy and the state‐variable approach to macroecology
Mooers et al. Using phylogenies to test macroevolutionary hypotheses of trait evolution in cranes (Gruinae)
WO2019134544A1 (en) Marketing information push method and device
CN111401700B (en) Data analysis method, device, computer system and readable storage medium
CN109583904A (en) Training method, impaired operation detection method and the device of abnormal operation detection model
CN106776925B (en) Method, server and system for predicting gender of mobile terminal user
CN110362492A (en) Intelligent algorithm test method, device, server, terminal and storage medium
JP2019521418A (en) Method of detecting disease probability, apparatus, equipment, and computer readable storage medium
CN103559205A (en) Parallel feature selection method based on MapReduce
JP5930551B2 (en) Residence point extraction method, residence point extraction device, and residence point extraction program
CN107146160A (en) Customer insured&#39;s analysis on the health status method and server
CN106815226A (en) Text matching technique and device
CN113971527A (en) Data risk assessment method and device based on machine learning
CN113641767B (en) Entity relation extraction method, device, equipment and storage medium
CN110797046B (en) Method and device for establishing prediction model of voice quality MOS value
US20230410222A1 (en) Information processing apparatus, control method, and program
CN111491262A (en) Method and device for determining signal strength of mobile broadband network
e Silva et al. Formulating conservation targets for a gap analysis of endemic lizards in a biodiversity hotspot
JP2018077765A (en) Information processing device, information processing method, and information processing program
Ogweno et al. Comparing the CENA GMPEs using NGA‐East ground‐motion database
CN109121133B (en) Location privacy protection method and device
Forkman et al. Performance of empirical BLUP and Bayesian prediction in small randomized complete block experiments
Okamura et al. A generalized model for overdispersed count data

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20160113

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20161026

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20161129

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170113

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20170613

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20170720

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20170926

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20170928

R150 Certificate of patent or registration of utility model

Ref document number: 6219743

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150

LAPS Cancellation because of no payment of annual fees