JP7014696B2 - Devices, methods and systems that estimate running applications in terminals - Google Patents

Devices, methods and systems that estimate running applications in terminals Download PDF

Info

Publication number
JP7014696B2
JP7014696B2 JP2018210642A JP2018210642A JP7014696B2 JP 7014696 B2 JP7014696 B2 JP 7014696B2 JP 2018210642 A JP2018210642 A JP 2018210642A JP 2018210642 A JP2018210642 A JP 2018210642A JP 7014696 B2 JP7014696 B2 JP 7014696B2
Authority
JP
Japan
Prior art keywords
communication log
communication
terminal
data link
running application
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2018210642A
Other languages
Japanese (ja)
Other versions
JP2020077244A (en
Inventor
宏紀 石塚
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
KDDI Corp
Original Assignee
KDDI Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by KDDI Corp filed Critical KDDI Corp
Priority to JP2018210642A priority Critical patent/JP7014696B2/en
Publication of JP2020077244A publication Critical patent/JP2020077244A/en
Application granted granted Critical
Publication of JP7014696B2 publication Critical patent/JP7014696B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Description

本発明は、端末における起動中アプリケーションを推定する技術に関する。 The present invention relates to a technique for estimating a running application in a terminal.

近年、ユーザは、様々なアプリケーションプログラム(AP(Application Program))を、自らのスマートフォンにインストールして利用することができる。
また、高速かつ大容量の通信が可能な無線通信インフラの普及によって、端末におけるデータ通信を伴うアプリケーションの利用も急増している。そのようなアプリケーションとしては、動画・チャット、通話、画像、ゲーム、地図などがある。
データ通信を伴うアプリケーションの利用の増加は、無線通信インフラに対する過負荷や輻輳の要因となる。そのために、無線通信事業者は、多数のユーザのアプリケーションの利用状況を正確に把握し、無線通信インフラへの柔軟な投資が必要となる。
In recent years, users can install and use various application programs (AP (Application Program)) on their smartphones.
In addition, with the spread of wireless communication infrastructure capable of high-speed and large-capacity communication, the use of applications involving data communication in terminals is rapidly increasing. Such applications include video / chat, phone calls, images, games, maps and the like.
Increased use of applications that involve data communication causes overload and congestion on wireless communication infrastructure. Therefore, wireless communication carriers need to accurately grasp the application usage status of a large number of users and flexibly invest in wireless communication infrastructure.

このような状況下、多数のユーザが、どのようなアプリケーションをスマートフォンで日常的に利用しているかを計測することは、通信事業者の観点のみならず、マーケティングの観点からも重要な問題となってきている。 Under these circumstances, measuring what applications many users use on their smartphones on a daily basis has become an important issue not only from the perspective of carriers but also from the perspective of marketing. It's coming.

従来、起動中アプリケーションの推定方式としては、「端末データ活用方式」と、「ネットワークデータ活用方式」とがある。
「端末データ活用方式」は、端末のメモリやCPUなどの制御ログや、各種センサ情報によるコンテキスト抽出結果を用いて、起動中のアプリケーションを推定するものである。
例えば、端末によって取得された位置情報と任意アプリケーションの起動履歴とを保存し、将来的なアプリケーションの起動を推定する技術がある(例えば特許文献1参照)。
また、端末内のシステム情報(CPU、メモリ、Bluetooth(登録商標)、WiFi情報、OS設定、バッテリー情報)やGPS、加速度センサ、通話情報、SMS情報など、あらゆる端末情報を用いて、起動中アプリケーションを推定する技術もある(例えば非特許文献2参照)。この場合、79%~87%程度の推定精度を達成している。
Conventionally, as an estimation method of a running application, there are a "terminal data utilization method" and a "network data utilization method".
The "terminal data utilization method" estimates the running application by using the control log of the memory of the terminal, the CPU, etc., and the context extraction result by various sensor information.
For example, there is a technique of saving the location information acquired by the terminal and the start history of an arbitrary application and estimating the start of the application in the future (see, for example, Patent Document 1).
In addition, the application being started using all terminal information such as system information (CPU, memory, Bluetooth (registered trademark), WiFi information, OS setting, battery information) in the terminal, GPS, accelerometer, call information, SMS information, etc. There is also a technique for estimating (see, for example, Non-Patent Document 2). In this case, the estimation accuracy of about 79% to 87% is achieved.

「ネットワーク活用方式」は、端末から送信される通信トラフィック量によって推定するものである。具体的には、OSI参照モデルにおけるトランスポート層及びネットワーク層における通信トラフィックを用いて、起動中アプリケーションを推定する。通信インフラ側で収集可能な各端末の通信トラフィックから起動中アプリケーションを推定するため、ユーザ側の端末に負担を欠けることがない。また、通信インフラ事業者は、自通信網と通信する端末における起動中アプリケーションを、網羅的に分析することができる。
例えば、各アプリケーションにおける通信時の宛先IPアドレスと送信パケットのペイロードとを特徴フィンガープリントとして学習し、起動中アプリケーションを推定する技術もある(例えば非特許文献3参照)。
また、起動中アプリケーションの通信時におけるDNS情報と通信トラフィックとを特徴フィンガープリントとして学習し、起動中アプリケーションを推定する技術もある(例えば特許文献2参照)。例えばネットワーク層のデータパケットを対象として、起動中アプリケーションを推定することもできる。
更に、アプリケーション起動時におけるTCPヘッダ情報のみを学習して、アプリケーションを識別する技術もある(例えば非特許文献4参照)。この技術によれば、頻繁に起動されるアプリケーションであれば、推定精度88%を達成し、学習データが数日程度経過した後であっても精度低下がないことが確かめられている。
The "network utilization method" is estimated based on the amount of communication traffic transmitted from the terminal. Specifically, the running application is estimated using the communication traffic in the transport layer and the network layer in the OSI reference model. Since the running application is estimated from the communication traffic of each terminal that can be collected on the communication infrastructure side, the burden on the user side terminal is not lost. In addition, the communication infrastructure operator can comprehensively analyze the running application in the terminal communicating with the own communication network.
For example, there is also a technique of learning the destination IP address at the time of communication in each application and the payload of the transmitted packet as a feature fingerprint to estimate the running application (see, for example, Non-Patent Document 3).
There is also a technique for estimating the running application by learning the DNS information and the communication traffic at the time of communication of the running application as a feature fingerprint (see, for example, Patent Document 2). For example, it is possible to estimate a running application for a data packet at the network layer.
Further, there is also a technique for identifying an application by learning only the TCP header information at the time of starting the application (see, for example, Non-Patent Document 4). According to this technique, it has been confirmed that an application that is started frequently achieves an estimation accuracy of 88% and that the accuracy does not decrease even after several days have passed since the training data.

特開2005-198345号公報Japanese Unexamined Patent Publication No. 2005-198345 特開2015-149695号公報JP-A-2015-149695

Q. Wang, A. Yahyavi, B. Kemme, and W. He, “I know what you did on your smartphone: Inferring app usage over encrypted data traffic,” 2015 IEEE Conf. Commun. Network Security, CNS 2015, pp. 433?441, 2015.Q. Wang, A. Yahyavi, B. Kemme, and W. He, “I know what you did on your smartphone: Inferring app usage over encrypted data traffic,” 2015 IEEE Conf. Commun. Network Security, CNS 2015, pp. 433? 441, 2015. Shin, C., Hong, J.-H., and Dey, A. K. Understanding and prediction of mobile application usage for smart phones. In Proc. of UbiComp’12, ACM (2012), 173?182Shin, C., Hong, J.-H., and Dey, A.K. Understanding and prediction of mobile application usage for smart phones. In Proc. Of UbiComp’12, ACM (2012), 173? 182 S. Dai, A. Tongaonkar, X. Wang, A. Nucci, and D. Song, “NetworkProfiler: Towards automatic fingerprinting of Android apps,” Proc. - IEEE INFOCOM, pp. 809?817, 2013.S. Dai, A. Tongaonkar, X. Wang, A. Nucci, and D. Song, “NetworkProfiler: Towards automatic fingerprinting of Android apps,” Proc. --IEEE INFOCOM, pp. 809? 817, 2013. H. F. Alan and J. Kaur, “Can Android Applications Be Identified Using Only TCP/IP Headers of Their Launch Time Traffic?” In Proc. 9th ACM Conf. Secur. Priv. Wirel. Mob. Networks - WiSec ’16, New York, NewYork, USA: ACM Press, 2016, pp. 61-66..HF Alan and J. Kaur, “Can Android Applications Be Identified Using Only TCP / IP Headers of Their Launch Time Traffic?” In Proc. 9th ACM Conf. Secur. Priv. Wirel. Mob. Networks --WiSec '16, New York, NewYork, USA: ACM Press, 2016, pp. 61-66 ..

前述した端末データ活用方式によれば、ユーザが所持する端末のデータを収集する必要があるため、ユーザの協力が必要不可欠となる。特に、プライバシ保護や作業負荷の観点から、網羅的な無線通信インフラ上で、起動中アプリケーションを推定することは難しい。
また、前述したネットワークデータ活用方式によれば、自通信網に入出力する日々増加する全てのTCPパケットやIPパケット内をキャプチャして分析する必要があり、膨大な設備投資による導入コストが高いという課題がある。
更に、非特許文献1のように、暗号化されたパケットであっても盗聴可能な技術が登場しているため、同層におけるネットワークデータ活用方式は、プライバシ侵害の危険性を帯びている。
According to the terminal data utilization method described above, it is necessary to collect the data of the terminal owned by the user, so that the cooperation of the user is indispensable. In particular, it is difficult to estimate a running application on a comprehensive wireless communication infrastructure from the viewpoint of privacy protection and workload.
In addition, according to the network data utilization method described above, it is necessary to capture and analyze all TCP packets and IP packets that are input and output to and from the own communication network every day, and the introduction cost is high due to huge capital investment. There are challenges.
Further, as in Non-Patent Document 1, a technique capable of eavesdropping even an encrypted packet has appeared, so that the network data utilization method in the same layer has a risk of privacy infringement.

そこで、本発明は、無線通信事業者によるデータパケットの分析が低コストで、且つ、プライバシ侵害のリスクを低減した、端末における起動中アプリケーションを推定する装置、プログラム及び方法を提供することを目的とする。 Therefore, an object of the present invention is to provide a device, a program, and a method for estimating a running application in a terminal, in which analysis of data packets by a wireless communication operator is low cost and the risk of privacy infringement is reduced. do.

本発明によれば、基地局と無線通信している端末について、起動中アプリケーションを推定する推定装置であって、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンを有し、
推定段階として、
端末における無線データリンクのデータパケットが分断された通信ログを連結する通信ログ連結手段を有し、
機械学習エンジンは、通信ログ連結手段によって連結された通信ログを入力し、端末における起動中アプリケーション識別子を出力する
ことを特徴とする。
According to the present invention, it is an estimation device that estimates a running application for a terminal wirelessly communicating with a base station.
As a learning stage, it has a machine learning engine that builds a learning model using teacher data with the communication log of the wireless data link as the explanatory variable and the running application identifier as the objective variable.
As an estimation stage
It has a communication log concatenation means for concatenating communication logs in which data packets of wireless data links in terminals are divided.
The machine learning engine is characterized in that it inputs a communication log linked by a communication log linking means and outputs a running application identifier in a terminal.

本発明の推定装置における他の実施形態によれば、
無線データリンクの通信ログは、基地局に対する無線トラヒック量及び/又は接続時間であることも好ましい。
According to another embodiment of the estimation device of the present invention.
It is also preferable that the communication log of the wireless data link is the amount of wireless traffic to the base station and / or the connection time.

本発明の推定装置における他の実施形態によれば、
無線トラヒック量は、上りトラヒック量及び下りトラヒック量の両方を含む
ことも好ましい。
According to another embodiment of the estimation device of the present invention.
It is also preferable that the radio traffic amount includes both the up traffic amount and the down traffic amount.

本発明の推定装置における他の実施形態によれば、
通信ログ連結手段は、無線データリンクの通信中断によるデータパケットの分断(MRCS:Multi Records Combined into a Session)について、隣接する通信ログを連結する
ことも好ましい。
According to another embodiment of the estimation device of the present invention.
It is also preferable that the communication log linking means concatenates adjacent communication logs for data packet fragmentation (MRCS: Multi Records Combined into a Session) due to communication interruption of the wireless data link.

本発明の推定装置における他の実施形態によれば、
通信ログ連結手段は、端末が捕捉する基地局が変更されたハンドオーバに基づくデータパケットの分断(SSMR:Session Split into Multiple Records)について、隣接する通信ログを連結する
ことも好ましい。
According to another embodiment of the estimation device of the present invention.
It is also preferable that the communication log concatenating means concatenates adjacent communication logs for the data packet split (SSMR: Session Split into Multiple Records) based on the handover that the base station captured by the terminal is changed.

本発明によれば、基地局と無線通信している端末について、起動中アプリケーションを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンとして機能させ、
推定段階として、
端末における無線データリンクのデータパケットが分断された通信ログを連結する通信ログ連結手段として機能させ、
機械学習エンジンは、通信ログ連結手段によって連結された通信ログを入力し、端末における起動中アプリケーション識別子を出力する
ようにコンピュータを機能させることを特徴とする。
According to the present invention, for a terminal that is in wireless communication with a base station, it is a program that makes a computer mounted on a device that estimates a running application function.
As a learning stage, the communication log of the wireless data link is used as an explanatory variable, and the teacher data with the running application identifier as the objective variable is used to function as a machine learning engine that builds a learning model.
As an estimation stage
It functions as a communication log concatenation means for concatenating communication logs in which data packets of wireless data links in terminals are divided.
The machine learning engine is characterized in that the computer functions to input the communication log linked by the communication log linking means and output the running application identifier in the terminal.

本発明によれば、基地局と無線通信している端末における、無線データリンクの通信ログを取得した装置における起動中アプリケーション推定方法であって、
装置は、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンを有し、
推定段階として、
端末における無線データリンクのデータパケットが分断された通信ログを連結する第1のステップと、
機械学習エンジンが、第1のステップによって連結された通信ログを入力し、端末における起動中アプリケーション識別子を出力する第2のステップと
を実行することを特徴とする。
According to the present invention, it is a method of estimating a running application in a device that has acquired a communication log of a wireless data link in a terminal that is wirelessly communicating with a base station.
The device is
As a learning stage, it has a machine learning engine that builds a learning model using teacher data with the communication log of the wireless data link as the explanatory variable and the running application identifier as the objective variable.
As an estimation stage
The first step of concatenating the communication log in which the data packet of the wireless data link in the terminal is divided,
With the second step, the machine learning engine inputs the communication log linked by the first step and outputs the running application identifier in the terminal .
It is characterized by executing .

本発明の推定装置、プログラム及び方法によれば、無線通信事業者によるデータパケットの分析が低コストで、且つ、プライバシ侵害のリスクを低減した、端末における起動中アプリケーションを推定することができる。 According to the estimation device, program and method of the present invention, it is possible to estimate a running application in a terminal in which analysis of data packets by a wireless communication operator is low cost and the risk of privacy infringement is reduced.

本発明におけるシステム構成図である。It is a system block diagram in this invention. 本発明における機械学習エンジンの学習段階を表す説明図である。It is explanatory drawing which shows the learning stage of the machine learning engine in this invention. アプリケーション毎の通信ログの特性を表す説明図である。It is explanatory drawing which shows the characteristic of the communication log for each application. 本発明における機械学習エンジンの推定段階を表す説明図である。It is explanatory drawing which shows the estimation stage of the machine learning engine in this invention. 通信ログ連結部の処理を表すフローチャートである。It is a flowchart which shows the process of a communication log connection part. ドーマントによって分断された無線データリンクのデータパケットの連結を表す説明図である。It is explanatory drawing which shows the concatenation of the data packet of the radio data link which was divided by the Dormant. ハンドオーバによって分断された無線データリンクのデータパケットの連結を表す説明図である。It is explanatory drawing which shows the concatenation of the data packet of the radio data link divided by the handover.

以下では、本発明の実施の形態について、図面を用いて詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.

図1は、本発明におけるシステム構成図である。 FIG. 1 is a system configuration diagram in the present invention.

図1のシステムによれば、端末2は、例えばスマートフォンであって、ユーザ所望のアプリケーションをインストールして起動させることができる。また、端末2は、基地局3との間で無線データリンクを確立し、そのアプリケーションの挙動に応じて、基地局3を介してアプリケーションサーバ4と通信する。その際、端末2と基地局3との間では、無線データリンクのデータパケットが送受信される。 According to the system of FIG. 1, the terminal 2 is, for example, a smartphone, and can install and start an application desired by the user. Further, the terminal 2 establishes a wireless data link with the base station 3 and communicates with the application server 4 via the base station 3 according to the behavior of the application. At that time, the data packet of the wireless data link is transmitted and received between the terminal 2 and the base station 3.

ここで、端末2は、起動中のアプリケーションに応じて、基地局3との間で送受信する無線データリンクのデータパケットの挙動が異なる。例えばチャットサービスのアプリケーションの場合、少ないトラヒック量のデータパケットが、間欠的に送受信される。一方で、動画サービスのアプリケーションの場合、大きいトラヒック量のデータパケットが、連続的に送受信される。このような無線データリンクの通信ログ(CDRs:Call Detail
Records)は、通信事業者が運用する基地局3によって取得することができる。
Here, the terminal 2 differs in the behavior of the data packet of the wireless data link transmitted / received to / from the base station 3 depending on the application being activated. For example, in the case of a chat service application, a small amount of traffic data packets are transmitted and received intermittently. On the other hand, in the case of a video service application, a large amount of traffic data packets are continuously transmitted and received. Communication logs (CDRs: Call Detail) of such wireless data links
Records) can be acquired by the base station 3 operated by the telecommunications carrier.

本発明の推定装置1は、通信事業設備として設置されるものであって、端末2と基地局3との間の無線データリンクの通信ログを、基地局3から受信する。無線データリンクの通信ログを取得するために、端末2に別途のアプリケーションを起動させたり、端末2が自ら、通信ログを推定装置1へ送信する必要もない。
本発明の推定装置1は、端末2と基地局3との間で送受信された無線データリンクの通信ログに基づいて、当該端末2における起動中アプリケーションを推定することができる。特に、無線データリンクの通信ログを用いることによって、無線通信事業者によるデータパケットの分析が低コストで、且つ、プライバシ侵害のリスクを低減することができる。
The estimation device 1 of the present invention is installed as a communication business facility, and receives a communication log of a wireless data link between a terminal 2 and a base station 3 from a base station 3. In order to acquire the communication log of the wireless data link, it is not necessary to start a separate application on the terminal 2 or to send the communication log to the estimation device 1 by the terminal 2 itself.
The estimation device 1 of the present invention can estimate the running application in the terminal 2 based on the communication log of the wireless data link transmitted / received between the terminal 2 and the base station 3. In particular, by using the communication log of the wireless data link, it is possible to reduce the cost of analyzing the data packet by the wireless communication operator and reduce the risk of privacy infringement.

図1によれば、推定装置1は、機械学習エンジン10と、通信ログ連結部11と、端末管理データベース12とを有する。これら機能構成部は、推定装置1に搭載されたコンピュータを機能させるプログラムを実行することによって実現できる。また、これら機能構成部の処理の流れは、端末における起動中アプリケーションの推定方法としても理解できる。 According to FIG. 1, the estimation device 1 has a machine learning engine 10, a communication log connecting unit 11, and a terminal management database 12. These functional components can be realized by executing a program for operating the computer mounted on the estimation device 1. In addition, the processing flow of these functional components can be understood as a method of estimating a running application on a terminal.

[機械学習エンジン10]
機械学習エンジン10は、教師データによって学習モデルを構築したものである。機械学習エンジン10は、起動中アプリケーションの挙動によって発生した無線データリンクの通信ログを特徴量として、機械学習によってその起動中アプリケーションを推定することができる。
[Machine learning engine 10]
The machine learning engine 10 is a learning model constructed from teacher data. The machine learning engine 10 can estimate the running application by machine learning using the communication log of the wireless data link generated by the behavior of the running application as a feature quantity.

図2は、本発明における機械学習エンジンの学習段階を表す説明図である。 FIG. 2 is an explanatory diagram showing a learning stage of the machine learning engine in the present invention.

図2によれば、教師データは、以下のようなものである。
説明変数:無線データリンクの通信ログ
目的変数:起動中アプリケーションID
通信ログは、無線データリンクの複数のデータパケットの集合である。具体的には、無線データリンクのデータパケットの「上り無線トラヒック量」「下り無線トラヒック量」「接続時間」(接続開始時刻-接続切断時刻)である。
According to FIG. 2, the teacher data is as follows.
Explanatory variable: Wireless data link communication log Objective variable: Running application ID
A communication log is a collection of multiple data packets on a wireless data link. Specifically, it is the "upstream wireless traffic amount", "downlink wireless traffic amount", and "connection time" (connection start time-connection disconnection time) of the data packet of the wireless data link.

起動中アプリケーションとしては、例えば以下のような種類がある。
動画サービスアプリケーション
チャットサービスアプリケーション
通話サービスアプリケーション
画像サービスアプリケーション
ゲームサービスアプリケーション
地図サービスアプリケーション
For example, there are the following types of running applications.
Video service application Chat service application Call service application Image service application Game service application Map service application

機械学習エンジン10は、具体的に以下のような分類器である。
サポートベクタマシン:教師あり学習を用いるパターン認識モデルであり、分類や回帰に適用可能な学習アルゴリズムである。
KNN(K Nearest Neighbor):学習データをベクトル空間上にプロットし、未知のデータに対して距離が近い順に任意のK個を取得し、多数決でデータが属するクラスを推定する学習アルゴリズムである。
決定木:ある事項に対する観察結果から、その事項の目標値に関する結論を導く予測モデルである。内部節点は変数に対応し、子節点への枝はその変数の取り得る値を示す。 葉(端点)は、根(root)からの経路によって表される変数値に対して、目的変数の予測値を表す。
ランダムフォレスト(Random Forest):決定木を弱学習器とする集団学習アルゴリズムである。
Naive Bayes:ベイズの定理に基づく教師あり学習アルゴリズムである。
ニューラルネットワーク(neural network):人間の脳神経系のニューロンを数理モデル化した学習アルゴリズムである。
The machine learning engine 10 is specifically a classifier as follows.
Support vector machine: A pattern recognition model that uses supervised learning, and is a learning algorithm that can be applied to classification and regression.
KNN (K Nearest Neighbor): A learning algorithm that plots training data on a vector space, acquires arbitrary K pieces in order of proximity to unknown data, and estimates the class to which the data belongs by majority vote.
Decision tree: A predictive model that draws conclusions about the target value of a certain item from the observation results of that item. Internal nodes correspond to variables, and branches to child nodes indicate possible values for that variable. The leaf (end point) represents the predicted value of the objective variable with respect to the variable value represented by the route from the root.
Random Forest: A group learning algorithm that uses a decision tree as a weak learner.
Naive Bayes: A supervised learning algorithm based on Bayes' theorem.
Neural network: A learning algorithm that mathematically models the neurons of the human cranial nerve system.

図3は、アプリケーション毎の通信ログの特性を表す説明図である。 FIG. 3 is an explanatory diagram showing the characteristics of the communication log for each application.

図3によれば、起動中アプリケーションの挙動によって発生した無線データリンクの通信ログを特徴量(上り無線トラヒック量、下り無線トラヒック量、接続時間)を表す。例えばチャットサービスのアプリケーションの場合、上り無線トラヒック量及び下り無線トラヒック量が少なく、接続時間も短い。一方で、例えば動画サービスのアプリケーションの場合、上り無線トラヒック量及び下り無線トラヒック量が多く、接続時間も長い。 According to FIG. 3, the communication log of the wireless data link generated by the behavior of the running application represents a feature amount (uplink wireless traffic amount, downlink wireless traffic amount, connection time). For example, in the case of a chat service application, the amount of uplink radio traffic and the amount of downlink radio traffic are small, and the connection time is short. On the other hand, for example, in the case of a video service application, the amount of uplink wireless traffic and the amount of downlink wireless traffic are large, and the connection time is long.

図4は、本発明における機械学習エンジンの推定段階を表す説明図である。 FIG. 4 is an explanatory diagram showing an estimation stage of the machine learning engine in the present invention.

機械学習エンジン10は、端末2における起動中アプリケーションによって発生した無線データリンクにおける連続的な所定数n個の通信ログ(説明変数)を入力する。
そして、機械学習エンジン10は、予め構築した学習モデルを用いて、当該端末2における起動中アプリケーション識別子(目的変数)を出力する。
図4によれば、例えば上り無線トラヒック量及び下り無線トラヒック量が多く、接続時間も長い、無線データリンクの通信ログに対して、動画サービスのアプリケーションIDを出力している。
The machine learning engine 10 inputs a predetermined number of continuous communication logs (explanatory variables) in the wireless data link generated by the running application in the terminal 2.
Then, the machine learning engine 10 outputs the running application identifier (objective variable) in the terminal 2 by using the learning model constructed in advance.
According to FIG. 4, for example, the application ID of the video service is output to the communication log of the wireless data link having a large amount of uplink radio traffic and a large amount of downlink radio traffic and a long connection time.

尚、前述した図1によれば、推定装置1は、基地局3から無線データリンクの通信ログを受信するように表しているが、推定装置1内に、端末における起動中アプリケーションによって発生した無線データリンクにおける通信ログを保存したデータベースを、予め蓄積したものであってもよい。 According to FIG. 1 described above, the estimation device 1 is represented to receive the communication log of the radio data link from the base station 3, but the radio generated in the estimation device 1 by the running application in the terminal. The database in which the communication log of the data link is stored may be stored in advance.

[端末管理データベース12]
端末管理データベース12は、機械学習エンジン10によって推定された起動中アプリケーション識別子と、端末とを対応付けて記憶する。
[Terminal management database 12]
The terminal management database 12 stores the running application identifier estimated by the machine learning engine 10 in association with the terminal.

[通信ログ連結部11]
通信ログ連結部11は、無線データリンクのデータパケットが分断された通信ログを連結し、連結した通信ログを機械学習エンジン10へ出力する。
[Communication log connection unit 11]
The communication log connecting unit 11 concatenates the communication logs in which the data packets of the wireless data link are divided, and outputs the concatenated communication logs to the machine learning engine 10.

無線データリンクでは、データパケットについて、以下の2つの分断現象が生じる場合がある。
(1)無線データリンクの通信中断(ドーマント)によるデータパケットの分断(MRCS:Multi Records Combined into a Session)
(2)端末が捕捉する基地局が変更されたハンドオーバによるデータパケットの分断(SSMR:Session Split into Multiple Records)
In a wireless data link, the following two division phenomena may occur for a data packet.
(1) Data packet fragmentation due to communication interruption (dormant) of wireless data link (MRCS: Multi Records Combined into a Session)
(2) Data packet split (SSMR: Session Split into Multiple Records) due to handover that the base station captured by the terminal is changed.

起動中アプリケーションの挙動によって無線データリンクのデータパケットが発生しても、そのデータパケットが無線データリンクの影響によって分断された場合、通信ログから起動中アプリケーションを推定することは難しい。即ち、無線データリンクの通信ログの分断は、正しいアプリケーション単位の通信ログを取得できないために、判定精度の著しい低下を招く。 Even if a data packet of a wireless data link is generated due to the behavior of a running application, if the data packet is divided by the influence of the wireless data link, it is difficult to estimate the running application from the communication log. That is, the division of the communication log of the wireless data link causes a significant decrease in the determination accuracy because the correct communication log for each application cannot be acquired.

ここで、通信ログ連結部11は、無線データリンクにおける分断現象によって生じた通信ログ同士を連結しながら、機械学習エンジン10へ出力する。これによって、機械学習エンジン10は、通信ログの分断を考慮することなく、起動中アプリケーション識別子を推定することができる。 Here, the communication log connecting unit 11 outputs to the machine learning engine 10 while connecting the communication logs generated by the division phenomenon in the wireless data link. As a result, the machine learning engine 10 can estimate the running application identifier without considering the division of the communication log.

図5は、通信ログ連結部の処理を表すフローチャートである。 FIG. 5 is a flowchart showing the processing of the communication log connecting unit.

通信ログ連結部11は、端末2における起動中アプリケーションによって発生した無線データリンクにおける連続的な通信ログ(説明変数)を入力する。
データパケットの分断は、データパケットの通信ログに記録されるRIT(Record Interval Time)の有無によって確認される。RITの発生が認められた場合、MRCS(Multi Records Combined into a Session)で、通信ログを連結する。
The communication log connecting unit 11 inputs a continuous communication log (explanatory variable) in the wireless data link generated by the running application in the terminal 2.
The division of the data packet is confirmed by the presence or absence of RIT (Record Interval Time) recorded in the communication log of the data packet. If the occurrence of RIT is recognized, the communication logs are linked by MRCS (Multi Records Combined into a Session).

(S111)通信ログ連結部11は、ドーマントによって分断された無線データリンクのデータパケットの通信ログを連結する。
ここで、通信ログの連結とは、隣接する通信ログ同士における無線トラヒック量や接続時間を加算して、1つの通信ログにマージすることをいう。
(S111) The communication log connecting unit 11 concatenates the communication logs of the data packets of the radio data link divided by the dormant.
Here, concatenation of communication logs means adding the amount of radio traffic and connection time between adjacent communication logs and merging them into one communication log.

図6は、ドーマントによって分断された無線データリンクのデータパケットの連結を表す説明図である。 FIG. 6 is an explanatory diagram showing the concatenation of data packets of a radio data link divided by a dormant.

図6によれば、最初には、端末2の起動中アプリケーションによって無線データリンクから送信しようとするデータパケットは、そのまま、基地局3へ送信されている。基地局3は、その無線データリンクのデータパケットによって通信ログを生成し、その通信ログを推定装置1へ送信する。
その後、端末2と基地局3との間で発生したドーマントによって、無線データリンクのデータパケットは分断され、分断されたまま、基地局3へ送信されている。基地局3は、分断された無線データリンクのデータパケットによって通信ログを生成し、その通信ログを推定装置1へ送信する。推定装置1は、通信ログからドーマントによるデータパケットの分断を検知し、通信ログを連結する。
According to FIG. 6, first, the data packet to be transmitted from the wireless data link by the running application of the terminal 2 is transmitted to the base station 3 as it is. The base station 3 generates a communication log from the data packet of the wireless data link, and transmits the communication log to the estimation device 1.
After that, the data packet of the wireless data link is divided by the dormant generated between the terminal 2 and the base station 3, and is transmitted to the base station 3 in the divided state. The base station 3 generates a communication log from the data packet of the divided wireless data link, and transmits the communication log to the estimation device 1. The estimation device 1 detects the division of the data packet by the dormant from the communication log and concatenates the communication log.

(S112)通信ログ連結部11は、ハンドオーバによって分断された無線データリンクのデータパケットの通信ログを連結する。
ハンドオーバとは、端末2が捕捉する基地局3が変更されることをいう。
(S112) The communication log connecting unit 11 concatenates the communication logs of the data packets of the wireless data link divided by the handover.
Handover means that the base station 3 captured by the terminal 2 is changed.

図7は、ハンドオーバによって分断された無線データリンクのデータパケットの連結を表す説明図である。 FIG. 7 is an explanatory diagram showing the concatenation of data packets of the radio data link divided by the handover.

図7によれば、最初には、端末2の起動中アプリケーションによって無線データリンクから送信しようとするデータパケットは、そのまま、基地局3へ送信されている。基地局3は、その無線データリンクのデータパケットによって通信ログを生成し、その通信ログを推定装置1へ送信する。
その後、端末2と複数の基地局3との間で発生したハンドオーバによって、無線データリンクのデータパケットは分断され、分断されたまま、各基地局3へ送信されている。各基地局3は、分断された無線データリンクのデータパケットによって通信ログを生成し、その通信ログを推定装置1へ送信する。推定装置1は、通信ログからハンドオーバによるデータパケットの分断を検知し、通信ログを連結する。
According to FIG. 7, at first, the data packet to be transmitted from the wireless data link by the running application of the terminal 2 is transmitted to the base station 3 as it is. The base station 3 generates a communication log from the data packet of the wireless data link, and transmits the communication log to the estimation device 1.
After that, the data packet of the wireless data link is divided by the handover generated between the terminal 2 and the plurality of base stations 3, and is transmitted to each base station 3 while being divided. Each base station 3 generates a communication log from the data packet of the divided wireless data link, and transmits the communication log to the estimation device 1. The estimation device 1 detects the division of the data packet due to the handover from the communication log, and concatenates the communication logs.

以上、詳細に説明したように、本発明の推定装置、プログラム及び方法によれば、無線通信事業者によるデータパケットの分析が低コストで、且つ、プライバシ侵害のリスクを低減した、端末における起動中アプリケーションを推定することができる。 As described above in detail, according to the estimation device, the program and the method of the present invention, the analysis of the data packet by the wireless communication carrier is low cost and the risk of privacy infringement is reduced, and the terminal is being activated. The application can be estimated.

前述した本発明の種々の実施形態について、本発明の技術思想及び見地の範囲の種々の変更、修正及び省略は、当業者によれば容易に行うことができる。前述の説明はあくまで例であって、何ら制約しようとするものではない。本発明は、特許請求の範囲及びその均等物として限定するものにのみ制約される。 Various modifications, modifications and omissions of the above-mentioned various embodiments of the present invention within the scope of the technical idea and viewpoint of the present invention can be easily carried out by those skilled in the art. The above explanation is just an example and does not attempt to limit anything. The present invention is limited only to the scope of claims and their equivalents.

1 推定装置
10 機械学習エンジン
11 通信ログ連結部
12 端末管理データベース
2 端末
3 基地局
4 アプリケーションサーバ
1 Estimator 10 Machine learning engine 11 Communication log connection unit 12 Terminal management database 2 Terminal 3 Base station 4 Application server

Claims (7)

基地局と無線通信している端末について、起動中アプリケーションを推定する推定装置であって、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンを有し、
推定段階として、
前記端末における無線データリンクのデータパケットが分断された通信ログを連結する通信ログ連結手段を有し、
前記機械学習エンジンは、前記通信ログ連結手段によって連結された通信ログを入力し、前記端末における起動中アプリケーション識別子を出力する
ことを特徴とする推定装置。
An estimation device that estimates running applications for terminals that are in wireless communication with base stations.
As a learning stage, it has a machine learning engine that builds a learning model using teacher data with the communication log of the wireless data link as the explanatory variable and the running application identifier as the objective variable.
As an estimation stage
It has a communication log linking means for linking communication logs in which data packets of a wireless data link in the terminal are divided.
The machine learning engine is an estimation device, characterized in that it inputs a communication log linked by the communication log linking means and outputs a running application identifier in the terminal.
前記無線データリンクの通信ログは、基地局に対する無線トラヒック量及び/又は接続時間である
ことを特徴とする請求項1に記載の推定装置。
The estimation device according to claim 1, wherein the communication log of the wireless data link is a wireless traffic amount and / or a connection time with respect to a base station.
前記無線トラヒック量は、上りトラヒック量及び下りトラヒック量の両方を含む
ことを特徴とする請求項2に記載の推定装置。
The estimation device according to claim 2, wherein the radio traffic amount includes both an upstream traffic amount and a downstream traffic amount.
前記通信ログ連結手段は、無線データリンクの通信中断によるデータパケットの分断(MRCS:Multi Records Combined into a Session)について、隣接する通信ログを連結する
ことを特徴とする請求項1から3のいずれか1項に記載の推定装置。
One of claims 1 to 3, wherein the communication log linking means concatenates adjacent communication logs for data packet fragmentation (MRCS: Multi Records Combined into a Session) due to communication interruption of a wireless data link. The estimation device according to item 1 .
前記通信ログ連結手段は、端末が捕捉する基地局が変更されたハンドオーバに基づくデータパケットの分断(SSMR:Session Split into Multiple Records)について、隣接する通信ログを連結する
ことを特徴とする請求項1から4のいずれか1項に記載の推定装置。
The communication log linking means is characterized in that adjacent communication logs are linked for data packet splitting (SSMR: Session Split into Multiple Records) based on a handover in which a base station captured by a terminal is changed. The estimation device according to any one of 4 to 4 .
基地局と無線通信している端末について、起動中アプリケーションを推定する装置に搭載されたコンピュータを機能させるプログラムであって、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンとして機能させ、
推定段階として、
前記端末における無線データリンクのデータパケットが分断された通信ログを連結する通信ログ連結手段として機能させ、
前記機械学習エンジンは、前記通信ログ連結手段によって連結された通信ログを入力し、前記端末における起動中アプリケーション識別子を出力する
ようにコンピュータを機能させることを特徴とするプログラム。
It is a program that makes the computer installed in the device that estimates the running application function for the terminal that is wirelessly communicating with the base station.
As a learning stage, the communication log of the wireless data link is used as an explanatory variable, and the teacher data with the running application identifier as the objective variable is used to function as a machine learning engine that builds a learning model.
As an estimation stage
The data packet of the wireless data link in the terminal is made to function as a communication log connecting means for connecting the divided communication logs.
The machine learning engine is a program characterized in that a computer functions to input a communication log linked by the communication log linking means and output a running application identifier in the terminal.
基地局と無線通信している端末における、無線データリンクの通信ログを取得した装置における起動中アプリケーション推定方法であって、
前記装置は、
学習段階として、無線データリンクの通信ログを説明変数とし、起動中アプリケーション識別子を目的変数とした教師データによって、学習モデルを構築した機械学習エンジンを有し、
推定段階として、
前記端末における無線データリンクのデータパケットが分断された通信ログを連結する第1のステップと、
前記機械学習エンジンが、第1のステップによって連結された通信ログを入力し、前記端末における起動中アプリケーション識別子を出力する第2のステップと
を実行することを特徴とする装置の起動中アプリケーション推定方法。
This is a method for estimating a running application in a device that has acquired a communication log of a wireless data link in a terminal that is wirelessly communicating with a base station.
The device is
As a learning stage, it has a machine learning engine that builds a learning model using teacher data with the communication log of the wireless data link as the explanatory variable and the running application identifier as the objective variable.
As an estimation stage
The first step of concatenating the communication log in which the data packet of the wireless data link in the terminal is divided is
With the second step, the machine learning engine inputs the communication log connected by the first step and outputs the running application identifier in the terminal.
A method of estimating a running application of a device, characterized by running.
JP2018210642A 2018-11-08 2018-11-08 Devices, methods and systems that estimate running applications in terminals Active JP7014696B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2018210642A JP7014696B2 (en) 2018-11-08 2018-11-08 Devices, methods and systems that estimate running applications in terminals

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2018210642A JP7014696B2 (en) 2018-11-08 2018-11-08 Devices, methods and systems that estimate running applications in terminals

Publications (2)

Publication Number Publication Date
JP2020077244A JP2020077244A (en) 2020-05-21
JP7014696B2 true JP7014696B2 (en) 2022-02-01

Family

ID=70724194

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2018210642A Active JP7014696B2 (en) 2018-11-08 2018-11-08 Devices, methods and systems that estimate running applications in terminals

Country Status (1)

Country Link
JP (1) JP7014696B2 (en)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPWO2022113267A1 (en) * 2020-11-27 2022-06-02

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012217061A (en) 2011-04-01 2012-11-08 Hitachi Ltd Network system and communication log analysis system
JP2015065601A (en) 2013-09-26 2015-04-09 株式会社日立製作所 Mobile network system
US20150333986A1 (en) 2014-05-15 2015-11-19 At&T Intellectual Property I, L.P. Predicting video engagement from wireless network measurements
WO2016017086A1 (en) 2014-07-31 2016-02-04 日本電気株式会社 Behavioral feature prediction system, behavioral feature prediction device, method and program
JP2016127359A (en) 2014-12-26 2016-07-11 Kddi株式会社 Communication controller
JP2016224566A (en) 2015-05-27 2016-12-28 一般財団法人電力中央研究所 Prediction device, prediction method, and prediction program
JP2018504050A (en) 2015-01-27 2018-02-08 ノキア ソリューションズ アンド ネットワークス オサケユキチュア Traffic flow monitoring

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2012217061A (en) 2011-04-01 2012-11-08 Hitachi Ltd Network system and communication log analysis system
JP2015065601A (en) 2013-09-26 2015-04-09 株式会社日立製作所 Mobile network system
US20150333986A1 (en) 2014-05-15 2015-11-19 At&T Intellectual Property I, L.P. Predicting video engagement from wireless network measurements
WO2016017086A1 (en) 2014-07-31 2016-02-04 日本電気株式会社 Behavioral feature prediction system, behavioral feature prediction device, method and program
JP2016127359A (en) 2014-12-26 2016-07-11 Kddi株式会社 Communication controller
JP2018504050A (en) 2015-01-27 2018-02-08 ノキア ソリューションズ アンド ネットワークス オサケユキチュア Traffic flow monitoring
JP2016224566A (en) 2015-05-27 2016-12-28 一般財団法人電力中央研究所 Prediction device, prediction method, and prediction program

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
沢辺 亜南 外2名,暗号化トラヒック分析を用いたスマートフォンの利用アプリケーション判定,電子情報通信学会技術研究報告,Vol.117 No.351,日本,一般社団法人 電子情報通信学会,2017年12月07日,pp. 1--6

Also Published As

Publication number Publication date
JP2020077244A (en) 2020-05-21

Similar Documents

Publication Publication Date Title
US20210211369A1 (en) System and method for extracting identifiers from traffic of an unknown protocol
US20150312296A1 (en) Method and device for pushing multimedia resource and display terminal
CN106778229B (en) VPN-based malicious application downloading interception method and system
CN102983942B (en) Data transmission method and equipment
CN111211980B (en) Transmission link management method, transmission link management device, electronic equipment and storage medium
CN110247819B (en) Wi-Fi video acquisition equipment detection method and system based on encrypted stream identification
US9510181B2 (en) Image-based remote subscriber identity module activation
JP7014696B2 (en) Devices, methods and systems that estimate running applications in terminals
Bisio et al. Context‐awareness over transient cloud in D2D networks: energy performance analysis and evaluation
US10057776B2 (en) Containing internet of things (IOT) analytics poisoning on wireless local access networks (WLANs)
CN110267125B (en) Intelligent meter reading method and related products
CN107368334B (en) Business plug-in interaction system and method
CN108235823A (en) Agency is without roaming cellular
CN112367215B (en) Network traffic protocol identification method and device based on machine learning
CN113159000A (en) Face recognition method, device and system
CN106899954A (en) Wireless communication system cut-in method, device and terminal
CN108109625B (en) Mobile phone voice recognition internal and external network transmission system and method
JP6157189B2 (en) Identification device, identification method, and identification program
KR20200056029A (en) Anonymous network analysis system using passive fingerprinting and method thereof
CN111159509B (en) Data processing method and related product
CN106302451A (en) The method and device of resource acquisition
CN110430098B (en) Data processing system
CN106936663B (en) Method and device for determining application installed in terminal
CN115885520A (en) Data processing apparatus, method and program
Espinal et al. Traffic analysis of internet applications on mobile devices over LTE and wireless networks

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20201118

A871 Explanation of circumstances concerning accelerated examination

Free format text: JAPANESE INTERMEDIATE CODE: A871

Effective date: 20210825

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20211007

A131 Notification of reasons for refusal

Free format text: JAPANESE INTERMEDIATE CODE: A131

Effective date: 20211105

A521 Request for written amendment filed

Free format text: JAPANESE INTERMEDIATE CODE: A523

Effective date: 20211214

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20220105

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20220120