JP6618971B2 - Estimation apparatus, estimation method, and program - Google Patents

Estimation apparatus, estimation method, and program Download PDF

Info

Publication number
JP6618971B2
JP6618971B2 JP2017202490A JP2017202490A JP6618971B2 JP 6618971 B2 JP6618971 B2 JP 6618971B2 JP 2017202490 A JP2017202490 A JP 2017202490A JP 2017202490 A JP2017202490 A JP 2017202490A JP 6618971 B2 JP6618971 B2 JP 6618971B2
Authority
JP
Japan
Prior art keywords
trial
unit
value
web page
time zone
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2017202490A
Other languages
Japanese (ja)
Other versions
JP2019075030A (en
Inventor
川口 銀河
銀河 川口
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Priority to JP2017202490A priority Critical patent/JP6618971B2/en
Publication of JP2019075030A publication Critical patent/JP2019075030A/en
Application granted granted Critical
Publication of JP6618971B2 publication Critical patent/JP6618971B2/en
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Debugging And Monitoring (AREA)
  • Telephone Function (AREA)

Description

本発明は、推定装置、推定方法及びプログラムに関する。   The present invention relates to an estimation device, an estimation method, and a program.

インターネットの利用が普及している中で、webブラウザを快適に利用できるかどうかが、ユーザが「インターネットを快適に利用できるか」について大きな位置を占めている。   With the widespread use of the Internet, whether or not a web browser can be used comfortably occupies a large position as to whether the user can use the Internet comfortably.

そのため、ユーザがwebページを閲覧する際の表示待ち時間を対象に品質管理することが重要である。   Therefore, it is important to perform quality control for the display waiting time when the user browses the web page.

また、一般にLTE(Long Term Evolution)に代表されるようなモバイルネットワークでは、混雑状況が、エリア・時間帯で異なるため、エリアごとに利用品質が異なり、また時間帯によっても品質が異なる。   In general, in a mobile network represented by LTE (Long Term Evolution), the congestion status varies depending on the area and time zone, so the use quality differs for each area, and the quality also varies depending on the time zone.

エリア・時間帯ごとの品質を把握する方法としては、個別端末から実際にコンテンツアクセスを行い計測する方法(アクティブ計測)がある(例えば、特許文献1)。   As a method of grasping the quality for each area / time zone, there is a method (active measurement) in which content is actually accessed and measured from an individual terminal (for example, Patent Document 1).

特開2017−92661号公報JP 2017-92661 A

しかしながら、各エリア・時間帯でアクティブ計測を行うのは経済的ではない。また、webページ・サーバは千差万別であり、個別のwebページごとに同じネットワークの品質劣化の影響下でも、表示待ち時間への影響に差異等があるため、webページの表示待ち時間の品質(劣化程度)の判断が困難である。   However, it is not economical to perform active measurement in each area and time zone. In addition, the web page server is very different, and there is a difference in the influence on the display waiting time even under the influence of the same network quality degradation for each individual web page. Judgment of quality (deterioration degree) is difficult.

本発明は、上記の点に鑑みてなされたものであって、個別のwebページの影響が除去された表示待ち時間の品質の推定を可能とすることを目的とする。   The present invention has been made in view of the above points, and an object of the present invention is to make it possible to estimate the quality of a display waiting time from which the influence of individual web pages is removed.

そこで上記課題を解決するため、推定装置は、地域及び時間帯の少なくともいずれか一方が異なる複数回の試行ごとに、webページの表示待ち時間の計測データに基づいて、前記表示待ち時間の品質を示す指標の代表値を算出する算出部と、前記試行ごとに、当該試行に係る前記代表値について、閾値との比較結果を示す論理値を出力する比較部と、前記試行ごとに、当該試行に係る地域及び時間帯のそれぞれにおける通信トラフィックの状況を示すパラメータを抽出する抽出部と、前記各試行の前記論理値を目的変数とし、前記各試行の前記パラメータを説明変数として推定器を学習させる学習部と、或る地域及び時間帯における前記パラメータを前記推定器に入力して、前記地域及び時間帯におけるwebページの表示待ち時間の品質を推定する推定部と、を有する。   Therefore, in order to solve the above-described problem, the estimation device determines the quality of the display waiting time based on the display waiting time measurement data on the web page for each of a plurality of trials in which at least one of the region and the time zone is different. A calculation unit that calculates a representative value of the index to be indicated, a comparison unit that outputs a logical value indicating a comparison result with a threshold value for the representative value related to the trial for each trial, and a trial for each trial. An extraction unit that extracts parameters indicating the status of communication traffic in each region and time zone, and learning that causes the estimator to learn using the logical value of each trial as an objective variable and the parameters of each trial as explanatory variables And the parameters in a certain region and time zone are input to the estimator, and the display latency quality of the web page in the region and time zone Having an estimation unit for estimating for.

個別のwebページの影響が除去された表示待ち時間の品質の推定を可能とすることができる。   It is possible to estimate the quality of the display latency without the influence of individual web pages.

本発明の実施の形態における推定装置10のハードウェア構成例を示す図である。It is a figure which shows the hardware structural example of the estimation apparatus 10 in embodiment of this invention. 本発明の実施の形態における推定装置10の機能構成例を示す図である。It is a figure which shows the function structural example of the estimation apparatus 10 in embodiment of this invention. web劣化分析部11が実行する処理手順の一例を説明するためのフローチャートである。It is a flowchart for demonstrating an example of the process sequence which the web deterioration analysis part 11 performs. トラフィック情報抽出部12が実行する処理手順の一例を説明するためのフローチャートである。It is a flowchart for demonstrating an example of the process sequence which the traffic information extraction part 12 performs. 学習段階において品質推定部13が実行する処理手順の一例を説明するためのフローチャートである。It is a flowchart for demonstrating an example of the process sequence which the quality estimation part 13 performs in a learning stage. 推定段階において推定装置10が実行する処理手順の一例を説明するためのフローチャートである。It is a flowchart for demonstrating an example of the process sequence which the estimation apparatus 10 performs in an estimation stage.

以下、図面に基づいて本発明の実施の形態を説明する。図1は、本発明の実施の形態における推定装置10のハードウェア構成例を示す図である。図1の推定装置10は、それぞれバスBで相互に接続されているドライブ装置100、補助記憶装置102、メモリ装置103、CPU104、及びインタ段階装置105等を有するコンピュータである。   Hereinafter, embodiments of the present invention will be described with reference to the drawings. FIG. 1 is a diagram illustrating a hardware configuration example of an estimation apparatus 10 according to an embodiment of the present invention. The estimation device 10 in FIG. 1 is a computer having a drive device 100, an auxiliary storage device 102, a memory device 103, a CPU 104, an inter-stage device 105, and the like that are mutually connected by a bus B.

推定装置10での処理を実現するプログラムは、CD−ROM等の記録媒体101によって提供される。プログラムを記憶した記録媒体101がドライブ装置100にセットされると、プログラムが記録媒体101からドライブ装置100を介して補助記憶装置102にインストールされる。但し、プログラムのインストールは必ずしも記録媒体101より行う必要はなく、ネットワークを介して他のコンピュータよりダウンロードするようにしてもよい。補助記憶装置102は、インストールされたプログラムを格納すると共に、必要なファイルやデータ等を格納する。   A program that realizes processing in the estimation apparatus 10 is provided by a recording medium 101 such as a CD-ROM. When the recording medium 101 storing the program is set in the drive device 100, the program is installed from the recording medium 101 to the auxiliary storage device 102 via the drive device 100. However, the program need not be installed from the recording medium 101 and may be downloaded from another computer via a network. The auxiliary storage device 102 stores the installed program and also stores necessary files and data.

メモリ装置103は、プログラムの起動指示があった場合に、補助記憶装置102からプログラムを読み出して格納する。CPU104は、メモリ装置103に格納されたプログラムに従って推定装置10に係る機能を実行する。インタ段階装置105は、ネットワークに接続するためのインタ段階として用いられる。   The memory device 103 reads the program from the auxiliary storage device 102 and stores it when there is an instruction to start the program. The CPU 104 executes a function related to the estimation device 10 according to a program stored in the memory device 103. The inter-stage device 105 is used as an inter-stage for connecting to a network.

図2は、本発明の実施の形態における推定装置10の機能構成例を示す図である。図2において、推定装置10は、web劣化分析部11、トラフィック情報抽出部12及び品質推定部13等を有する。これら各部は、推定装置10にインストールされた1以上のプログラムが、CPU104に実行させる処理により実現される。   FIG. 2 is a diagram illustrating a functional configuration example of the estimation device 10 according to the embodiment of the present invention. In FIG. 2, the estimation device 10 includes a web deterioration analysis unit 11, a traffic information extraction unit 12, a quality estimation unit 13, and the like. Each of these units is realized by processing that one or more programs installed in the estimation apparatus 10 cause the CPU 104 to execute.

web劣化分析部11は、エリア(地域)及び時間帯の組み合わせによって区別されるZ回の試行のそれぞれごとに、1種類以上(K種類)のwebページ(webコンテンツ)についての端末における表示待ち時間の計測結果の集合である端末計測データD1を分析する。web劣化分析部11は、分析の結果として、表示待ち時間の品質を示す指標の一例である劣化度等を出力する。   The web degradation analysis unit 11 displays the display waiting time at the terminal for one or more types (K types) of web pages (web contents) for each of Z trials distinguished by the combination of area (region) and time zone. Terminal measurement data D1, which is a set of measurement results, is analyzed. As a result of the analysis, the web deterioration analysis unit 11 outputs a deterioration degree, which is an example of an index indicating the quality of the display waiting time.

トラフィック情報抽出部12は、上記各試行のエリア及び時間帯におけるネットワークのトラフィック計測データD2から、通信トラフィックの状況を示すパラメータ等を抽出(取得)する。   The traffic information extraction unit 12 extracts (acquires) a parameter or the like indicating the state of communication traffic from the network traffic measurement data D2 in each trial area and time zone.

品質推定部13は、学習段階において、web劣化分析部11のから出力される情報とトラフィック情報抽出部12によって抽出される情報とを1以上推定器に学習させる。品質推定部13は、また、推定段階において、任意のエリア及び時間帯におけるトラフィック計測データD2が入力されると、当該エリア及び時間帯におけるwebページの表示待ち時間の劣化の程度を、1以上の推定器を用いて推定する。   In the learning stage, the quality estimation unit 13 causes the estimator to learn one or more information output from the web deterioration analysis unit 11 and information extracted by the traffic information extraction unit 12. In addition, when the traffic measurement data D2 in an arbitrary area and time zone is input in the estimation stage, the quality estimation unit 13 sets the degree of deterioration of the display waiting time of the web page in the area and time zone to 1 or more. Estimate using an estimator.

推定器は、例えば、SVM(Support Vector Machine)である。但し、数値ベクトルから1つの論理値を推定可能であれば他の推定器が用いられてもよい。   The estimator is, for example, an SVM (Support Vector Machine). However, other estimators may be used as long as one logical value can be estimated from a numerical vector.

端末計測データD1の収集方法の一例について説明する。ここでは、計測対象のwebページのURLとして、URL_1,URL_2...URL_K:(K個の計測対象URL;Kは1以上の任意の自然数(すなわち、1つのURLでもよい。))が設定されているとする。URLは、特定のものに限定されないが、よく利用されるようなwebページを多様な種類を含むのが望ましい。   An example of a method for collecting terminal measurement data D1 will be described. Here, URL_1, URL_2... URL_K: (K measurement target URLs; K is an arbitrary natural number of 1 or more (that is, one URL may be used)) is set as the URL of the measurement target web page. Suppose that The URL is not limited to a specific URL, but it is desirable to include various types of web pages that are frequently used.

試行ごとに以下が行われる。なお、試行とは、上記したように、計測対象のエリア及び時間帯(期間)の組み合わせによって区別される概念である。したがって、エリア及び時間帯の少なくともいずれか一方が異なると、試行は異なる。   For each trial: The trial is a concept that is distinguished by a combination of an area to be measured and a time zone (period) as described above. Therefore, if at least one of the area and the time zone is different, the trial is different.

(1)1つの試行に対応するエリア・時間帯について、K個の計測対象URLについて、表示待ち時間を、webページを表示可能な端末を用いてP回計測する。すなわち、1回の試行についてP×K回の計測が行われる。但し、全てのURLについて、Pの値は共通でなくてもよい。また、P=1であってもよい。すなわち、各URLについて、必ずしも複数回の計測が行われなくてもよい。当該エリア及び時間帯の代表値を取得するため、同一エリア及び同一時間帯の範囲内で、ある程度異なる場所及び時刻で計測が行われるのが望ましいが、計測パターン(例えば、同一エリア及び同一時間帯で、場所及び時刻をどのように選択するか)は任意でよく、計測手法は、特定のものに限定されない。また、表示待ち時間を取得する方法も特定のものに限定されないが、navigation timing APIを用いてnavigationStartとloadEventEndとの時間差を用いる方法が利用されてもよい。なお、各試行におけるP回の計測は、集計時間幅W内に終了するとする。   (1) For the area / time zone corresponding to one trial, the display waiting time is measured P times for K measurement target URLs using a terminal capable of displaying a web page. That is, P × K measurements are performed for one trial. However, the value of P may not be common for all URLs. Moreover, P = 1 may be sufficient. That is, it is not always necessary to perform multiple measurements for each URL. In order to obtain the representative values of the area and time zone, it is desirable that measurements are performed at somewhat different places and times within the same area and time zone, but the measurement pattern (for example, the same area and the same time zone) And how to select the place and time) may be arbitrary, and the measurement method is not limited to a specific one. The method for acquiring the display wait time is not limited to a specific method, but a method using a time difference between navigationStart and loadEventEnd using the navigation timing API may be used. Note that the P measurements in each trial are completed within the total time width W.

(2)(1)をZ通りの試行について実行する。   (2) Perform (1) for Z trials.

(1)及び(2)の実行の結果として取得される端末計測データD1は、以下において、「L(z,y,x)」として表記される計測値(表示待ち時間)の集合である。ここで、L(z,y,x)は、z回目(z:1〜Z)試行のy番目URL(y:1〜K)のx回目(x:1〜P)計測での表示待ち時間を示す。   The terminal measurement data D1 acquired as a result of the execution of (1) and (2) is a set of measurement values (display waiting time) denoted as “L (z, y, x)” below. Here, L (z, y, x) is a display waiting time in the x-th (x: 1 to P) measurement of the y-th URL (y: 1 to K) of the z-th (z: 1 to Z) trial. Indicates.

次に、トラフィック計測データD2の収集方法について説明する。こここでは、上記各試行に対応するエリア及び時間帯ごとの通信トラフィックの品質情報を、個別アクティブ計測なしに評価するため、例えば、当該エリア内の全て、又は(サンプリングしている場合は)一部の通信トラフィックを処理するルータ等の装置のモニタ用ポートにDPI(Deep Packet Inspection)装置を接続し、DPI装置を用いてトラフィックを監視することで、トラフィック計測データD2を収集する。したがって、トラフィック計測データD2は、DPI装置によって監視されるトラフィックの履歴情報(ログ)であってもよい。監視対象は、Z回の試行のそれぞれに対応するエリア及び時間帯(時間幅W)のトラフィックとする(但し、表示待ち時間の計測に関するトラフィックに限定されない)。表示待ち時間の計測がモバイル・LTEであれば特定の基地局(eNB)又は特定のセクタ(ECI)におけるトラフィックが監視対象とされ、固定網であれば特定の収容ルータ等におけるトラフィックが監視対象とされるが、これらの基地局、セクタ、又は収容ルータ等の特定方法は、所定のものに限定されない。網上流でモニタ出来る権限を持つものは当然に把握できているものとする。   Next, a method for collecting the traffic measurement data D2 will be described. Here, in order to evaluate the communication traffic quality information for each area and each time zone corresponding to each trial without the individual active measurement, for example, all of the area or (if sampling) one Traffic measurement data D2 is collected by connecting a DPI (Deep Packet Inspection) device to a monitoring port of a device such as a router that processes the communication traffic of each unit and monitoring the traffic using the DPI device. Therefore, the traffic measurement data D2 may be history information (log) of traffic monitored by the DPI device. The monitoring target is the traffic corresponding to each of the Z trials and the traffic in the time zone (time width W) (however, it is not limited to the traffic related to the measurement of the display waiting time). If the display waiting time measurement is mobile / LTE, traffic in a specific base station (eNB) or a specific sector (ECI) is to be monitored, and if it is a fixed network, traffic in a specific accommodating router or the like is to be monitored. However, the identification method of these base stations, sectors, accommodating routers, etc. is not limited to a predetermined one. It is assumed that those who have the authority to monitor at the upstream side of the network are naturally understood.

以下、推定装置10が実行する処理手順について説明する。図3は、web劣化分析部11が実行する処理手順の一例を説明するためのフローチャートである。   Hereinafter, the process procedure which the estimation apparatus 10 performs is demonstrated. FIG. 3 is a flowchart for explaining an example of a processing procedure executed by the web deterioration analysis unit 11.

ステップS101において、web劣化分析部11は、K個のURLのそれぞれについて、表示待ち時間に関する基準値を算出する。例えば、或るURLに対する基準値であれば、当該URLに係るZ×P個の計測値の中央値、10%値、最小値等が、基準値とされてもよい。又は、基準値は、推定装置10のユーザによって事前に設定されてもよい。以下、URL_1,URL_2...URL_Kに対する基準値を、Wb_1,Wb_2,..Wb_Kとする。この場合、中央値を基準値とするのであれば、Wb_1の基準値は以下の通りである。
Wb_1=(L(z,1,x)の表示待ち時間の集合の中央値)
続いて、web劣化分析部11は、Z回の試行ごとに、K個の各URLに対する「劣化度(Dw(z,y,x)」を以下のように算出する(S102)。
Dw(z,y,x)=L(z,y,x)/Wb_y
すなわち、劣化度Dw(z,y,x)は、基準値に対する計測値の割合であり、本実施の形態において、webページの表示待ち時間の品質(劣化の程度)を示す指標の一例である。なお、webページの表示待ち時間の品質を把握可能な方法であれば、他の方法によって劣化度Dw(z,y,x)が算出されてもよい。
In step S101, the web deterioration analysis unit 11 calculates a reference value related to the display waiting time for each of the K URLs. For example, if it is a reference value for a URL, the median value, 10% value, minimum value, etc. of Z × P measurement values related to the URL may be used as the reference value. Alternatively, the reference value may be set in advance by the user of the estimation device 10. Hereinafter, reference values for URL_1, URL_2 ... URL_K are set as Wb_1, Wb_2,. . Let Wb_K. In this case, if the median is used as the reference value, the reference value of Wb_1 is as follows.
Wb_1 = (median value of the set of display waiting times of L (z, 1, x))
Subsequently, the web deterioration analysis unit 11 calculates “deterioration degree (Dw (z, y, x))” for each of the K URLs for each of Z trials as follows (S102).
Dw (z, y, x) = L (z, y, x) / Wb_y
That is, the deterioration degree Dw (z, y, x) is a ratio of the measured value to the reference value, and is an example of an index indicating the quality (deterioration degree) of the display wait time of the web page in the present embodiment. . Note that the degradation degree Dw (z, y, x) may be calculated by another method as long as the quality of the display waiting time of the web page can be grasped.

続いて、web劣化分析部11は、Z回の試行ごとに、「劣化度代表値(D_z)」を算出する(S103)。   Subsequently, the web deterioration analysis unit 11 calculates a “deterioration degree representative value (D_z)” for every Z trials (S103).

具体的には、web劣化分析部11は、D_z=(Dw(i,j,l)のうち,iがzに固定され、j及びlは、それぞれが取りうる全ての値である集合(すなわち、P×K個の要素を含む集合)を、全てのzについて取り出し、各集合のそれぞれのd_th分位点(quantile)の値)を算出する。d_thは、分位点で与える劣化閾値であり、予め設定される。例えば、d_thが、0.8(すなわち、80パーセンタイル)であれば、Dw(z,j,l)の集合の80%値(80パーセンタイル)が算出される。なお、K=1であり、かつ、P=1である場合、劣化度代表値(D_z)=劣化度(Dw(z,1,1)とされてもよい。   More specifically, the web deterioration analysis unit 11 determines that a set of D_z = (Dw (i, j, l), i is fixed to z, and j and l are all possible values (ie, , A set including P × K elements) is extracted for all z, and the respective d_th quantile values of each set are calculated. d_th is a deterioration threshold given by the quantile, and is set in advance. For example, if d_th is 0.8 (that is, the 80th percentile), the 80% value (80th percentile) of the set of Dw (z, j, l) is calculated. When K = 1 and P = 1, the deterioration level representative value (D_z) = deterioration level (Dw (z, 1, 1) may be set.

続いて、web劣化分析部11は、Z回の試行ごとに「劣化度論理値(Db_(z,s))」を算出する(S104)。ここで、sは、D_zに対する劣化判定閾値劣化判定閾値に対する変数であり、本実施の形態では、予め、(−m,−(m−1),...,−1,0,1,2,...n−1,n)のm+n+1個だけ、多段階のTsh_sが設定される。すなわち、m及びnは、劣化判定閾値Tsh_sの数(段階数)を規定するパラメータであり、予め設定される。なお、n=mでもよいし、n≠mでもよい。また、推定器を1つのみ用いる場合には、m=n=0でよい(すなわち、Tsh_sは1つでよい)。   Subsequently, the web deterioration analysis unit 11 calculates “deterioration degree logical value (Db_ (z, s))” for each Z trials (S104). Here, s is a variable for the deterioration determination threshold for D_z. In the present embodiment, (−m, − (m−1),. ,...,..., N−1, n) are set to m + n + 1 multi-stage Tsh_s. That is, m and n are parameters that define the number (the number of steps) of the deterioration determination threshold value Tsh_s, and are set in advance. Note that n = m or n ≠ m. Further, when only one estimator is used, m = n = 0 may be used (that is, one Tsh_s may be used).

したがって、1回の試行に関して以下のように算出されるDb_(z,s)の個数は、m+n+1個である。
Db_(z,s)=bool(D_z>Tsh_s)
すなわち、各試行について、劣化判定閾値Tsh_sごとに、D_zと当該劣化判定閾値Tsh_sとが比較され、比較結果を示す論理値が、Db_(z,s)に代入される。
Therefore, the number of Db_ (z, s) calculated as follows for one trial is m + n + 1.
Db_ (z, s) = boole (D_z> Tsh_s)
That is, for each trial, for each deterioration determination threshold value Tsh_s, D_z is compared with the deterioration determination threshold value Tsh_s, and a logical value indicating the comparison result is substituted into Db_ (z, s).

Db_(z,s)は、真であれば「劣化」、偽であれば「非劣化」を表す論理値群であり、閾値の違い(sごと)で、異なる強度の劣化を表している。なお、劣化度代表値D_zは、s(閾値の種類)に非依存であり、劣化判定閾値Tsh_sは試行(z)に非依存)である。   Db_ (z, s) is a logical value group that represents “deterioration” if true, and “non-deterioration” if false, and represents different intensity degradations with different thresholds (for each s). The deterioration level representative value D_z is independent of s (threshold type), and the deterioration determination threshold value Tsh_s is independent of trial (z).

続いて、トラフィック情報抽出部12が実行する処理手順について説明する。図4は、トラフィック情報抽出部12が実行する処理手順の一例を説明するためのフローチャートである。   Next, a processing procedure executed by the traffic information extraction unit 12 will be described. FIG. 4 is a flowchart for explaining an example of a processing procedure executed by the traffic information extraction unit 12.

ステップS201において、トラフィック情報抽出部12は、変数iに1を代入する。変数iは、図4の説明において、各試行を識別するための変数である。以下、i番目の試行を「試行i」という。   In step S201, the traffic information extraction unit 12 substitutes 1 for a variable i. The variable i is a variable for identifying each trial in the description of FIG. Hereinafter, the i-th trial is referred to as “trial i”.

続いて、トラフィック情報抽出部12は、トラフィック計測データD2から、試行iに対応するログデータを取得する(S202)。具体的には、試行iに対応するエリア及び時間帯(集計時間幅W)に対応するログデータが取得される。以下、取得されたログデータに係る通信トラフィックを「対象トラフィック」という。試行iに対応するエリアは、エリアが基地局単位又はセクタ単位であり、ログデータにeNBのIPアドレス又はCIDが付与されている場合には、試行iに対応するエリアのeNBのIPアドレスに基づいて、又は当該エリアのセクタのCIDに基づいて、対象トラフィックのログデータを絞り込むことができる。一方、eNBのIPアドレス又はCIDがログデータに付与されていない場合、試行iに対応するエリアのモニタ用ポートで観測できる範囲が、試行iに対応するエリアに関するログデータとなる。   Subsequently, the traffic information extraction unit 12 acquires log data corresponding to the trial i from the traffic measurement data D2 (S202). Specifically, log data corresponding to the area and time zone (total time width W) corresponding to trial i is acquired. Hereinafter, the communication traffic related to the acquired log data is referred to as “target traffic”. The area corresponding to the trial i is based on the eNB IP address of the area corresponding to the trial i when the area is a base station unit or a sector unit and the log data is assigned the IP address or CID of the eNB. Or the log data of the target traffic can be narrowed down based on the CID of the sector in the area. On the other hand, when the IP address or CID of the eNB is not given to the log data, the range that can be observed at the monitoring port of the area corresponding to the trial i is the log data regarding the area corresponding to the trial i.

続くステップS203〜S207において、トラフィック情報抽出部12は、対象トラフィックに係るログデータから、試行iに係る通信トラフィックの状況を示すパラメータを抽出する。   In subsequent steps S203 to S207, the traffic information extraction unit 12 extracts a parameter indicating the status of the communication traffic related to the trial i from the log data related to the target traffic.

ステップS203において、トラフィック情報抽出部12は、対象トラフィックの特定のポート番号に係る時間内スループット及び総転送量に基づいて、以下のステップS203−1〜S203−3を実行することにより、試行iに関する低スループットの代表値を算出する。   In step S203, the traffic information extraction unit 12 performs the following steps S203-1 to S203-3 on the basis of the in-time throughput and the total transfer amount related to the specific port number of the target traffic, thereby regarding the trial i. Calculate a representative value for low throughput.

ステップS203−1において、トラフィック情報抽出部12は、対象トラフィックから、以下の(1)及び(2)の条件を満たすTCPフローを抽出する。
(1)TCPポートがthpt_portであること。ここで、thpt_portは、事前設定されるパラメータの一つであり、集計対象のTCPスループットのポート番号を示す。本実施の形態において、thpt_portの値は「80」である。
(2)更に、事前設定パラメータとして、th_thpt_L及びth_thpt_Uが設定されていれば、(1)に該当するTCPフローのうち、総転送量がth_thpt_L以上かつth_thpt_U以下のTCPフローであること。ここで、th_thpt_Lは、抽出対象の下限フローサイズであり、th_thpt_Uは、抽出対象の上限フローサイズを示す。なお、th_thpt_L及びth_thpt_Uのいずれについても、0が設定された場合には、(2)の条件は無効とされる。
In step S203-1, the traffic information extraction unit 12 extracts a TCP flow that satisfies the following conditions (1) and (2) from the target traffic.
(1) The TCP port is thpt_port. Here, thpt_port is one of preset parameters, and indicates the port number of the TCP throughput to be counted. In the present embodiment, the value of thpt_port is “80”.
(2) Further, if th_thpt_L and th_thpt_U are set as the preset parameters, the TCP flow corresponding to (1) is a TCP flow having a total transfer amount of th_thpt_L or more and th_thpt_U or less. Here, th_thpt_L is the lower limit flow size to be extracted, and th_thpt_U represents the upper limit flow size to be extracted. Note that if both th_thpt_L and th_thpt_U are set to 0, the condition (2) is invalidated.

ステップS203−2において、トラフィック情報抽出部12は、試行iの時間帯(集計時間幅W)を分割(細分化)する集計単位時間τごとに、抽出されたTCPフローごとのスループット値(時間内転送量/τ)を集計し、当該スループット値の集合のthpt_p1分位点の値を算出する。   In step S203-2, the traffic information extraction unit 12 determines the throughput value (within the time) for each extracted TCP flow for each aggregation unit time τ that divides (subdivides) the time zone (total time width W) of trial i. Transfer amount / τ) is totaled, and the value of thpt_p1 quantile of the set of throughput values is calculated.

ここで、thpt_p1及び以下のthpt_p2は、事前設定パラメータの一つであり、分位点(パーセンタイル)によって指定される、スループット値の抽出閾値である。したがって、例えば、thpt_p1が0.2の場合、集計されたスループット値の集合の20パーセンタイルが算出される。また、τも、事前設定パラメータの一つであり、W=τ*κとする(κは整数)。したがって、ステップS203−2は、κ回繰り返され、κ個のthpt_p1分位点の値の組が得られる。   Here, thpt_p1 and the following thpt_p2 are one of the preset parameters, and are throughput value extraction threshold values designated by quantiles (percentiles). Therefore, for example, when thpt_p1 is 0.2, the 20th percentile of the aggregated throughput value set is calculated. Also, τ is one of the preset parameters, and W = τ * κ (κ is an integer). Accordingly, step S203-2 is repeated κ times to obtain a set of κ thpt_p1 quantile values.

ステップS203−3において、トラフィック情報抽出部12は、κ個の値の組におけるthpt_p2(例えば、0.2等)分位点の値を算出する。ステップS203−3にて算出されたthpt_p2分位点の値が、スループットの代表値(以下、「Th1_z」という(zは1..Z)。)である。   In step S203-3, the traffic information extraction unit 12 calculates a thpt_p2 (for example, 0.2 etc.) quantile value in a set of κ values. The value of thpt_p2 quantile calculated in step S203-3 is a representative value of throughput (hereinafter referred to as “Th1_z” (z is 1. Z)).

ステップS203に続いて、トラフィック情報抽出部12は、対象トラフィック内のTCPフローのack応答等から計算したRTTサンプルに基づいて、以下のステップS204−1〜S204−3を実行することにより、試行iに関する高RTTの代表値を算出する(S204)。なお、TCPのパケット列からRTT(Round Trip Time)を算出する方法は、所定のものに限定されない。既存の方法の一例として、パケット分析ツールwiresharkにおいてtcp.analysis.ack_rttで読み取る方法が挙げられる。   Subsequent to step S203, the traffic information extracting unit 12 executes the following steps S204-1 to S204-3 based on the RTT sample calculated from the ack response of the TCP flow in the target traffic, thereby performing trial i. The representative value of the high RTT is calculated (S204). Note that a method for calculating RTT (Round Trip Time) from a TCP packet sequence is not limited to a predetermined method. As an example of an existing method, in the packet analysis tool wireshark, tcp. analysis. There is a method of reading with ack_rtt.

ステップS204−1において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、対象トラフィックに対するRTTデータ群を抽出する。   In step S204-1, the traffic information extraction unit 12 extracts an RTT data group for the target traffic for each total unit time τ of trial i.

ステップS204−2において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、抽出されたRTTデータ群のrtt_p1分位点の値を算出する。なお、ステップS204−1では、κ個のRTTデータ群が抽出されている。したがって、ステップS204−2では、κ個のrtt_p1分位点の値の組が算出される。なお、rtt_p1及び以下のthpt_p2は、事前設定パラメータの一つであり、スループット抽出閾値を分位点(例えば、0.1,0.2等)で指定する値である。   In step S204-2, the traffic information extraction unit 12 calculates the value of the rtt_p1 quantile of the extracted RTT data group for each aggregation unit time τ of trial i. In step S204-1, κ RTT data groups are extracted. Accordingly, in step S204-2, a set of values of κ rtt_p1 quantiles is calculated. Note that rtt_p1 and the following thpt_p2 are one of the preset parameters, and are values that specify the throughput extraction threshold value with quantile points (for example, 0.1, 0.2, etc.).

ステップS204−3において、トラフィック情報抽出部12は、κ個のrtt_p1分位点の値のrtt_p2分位点の値を算出する。ステップS204−3で算出されたrtt_p2分位点の値が、高RTTの代表値(以下、「Rtt1_z」という(zは1..Z)。)である。   In step S204-3, the traffic information extraction unit 12 calculates the value of the rtt_p2 quantile of κ rtt_p1 quantile values. The value of the rtt_p2 quantile calculated in step S204-3 is a representative value of high RTT (hereinafter referred to as “Rtt1_z” (z is 1. Z)).

ステップS204に続いて、トラフィック情報抽出部12は、対象トラフィック内のTCPフローの解析から計算したτごとのTCP再送発生比率(TCPパケット中の再送パケットの比率)に基づいて、以下のステップS205−1〜S205−2を実行することにより、試行iに関する再送率の代表値を算出する(S205)。なお、TCPのパケット列から再送を検出する方法は、所定のものに限定されない。既存の方法の一例として、パケット分析ツールwiresharkにおいてtcp.analysis.retransmission等のパラメータから評価する方法が挙げられる。   Subsequent to step S204, the traffic information extraction unit 12 performs the following step S205− based on the TCP retransmission occurrence ratio (ratio of retransmission packets in TCP packets) for each τ calculated from the analysis of the TCP flow in the target traffic. By executing 1 to S205-2, the representative value of the retransmission rate for trial i is calculated (S205). The method for detecting retransmission from a TCP packet sequence is not limited to a predetermined method. As an example of an existing method, in the packet analysis tool wireshark, tcp. analysis. There is a method of evaluating from parameters such as transmission.

ステップS205−1において、トラフィック情報抽出部12は、集計単位時間τごとに、対象トラフィックに対しての再送率を抽出する。したがって、κ個の再送率の値の組が得られる。   In step S205-1, the traffic information extraction unit 12 extracts a retransmission rate for the target traffic for each counting unit time τ. Therefore, a set of κ retransmission rate values is obtained.

ステップS205−2において、トラフィック情報抽出部12は、κ個の再送率のret_p分位点の値を算出する。なお、ret_pは、事前設定パラメータの一つであり、再送率抽出閾値を分位点(例えば、0.9,0.8等)で指定する値である。このret_p分位点の値が再送率の代表値(以下、「Ret1_z」という(zは1..Z)。)である。   In step S205-2, the traffic information extraction unit 12 calculates the value of the ret_p quantile of κ retransmission rates. Note that ret_p is one of the preset parameters, and is a value that designates the retransmission rate extraction threshold with a quantile (eg, 0.9, 0.8, etc.). The value of the ret_p quantile is a representative value of the retransmission rate (hereinafter referred to as “Ret1_z” (z is 1... Z)).

ステップS205に続いて、トラフィック情報抽出部12は、以下のステップS206−1〜S206−3を実行することにより、DNS応答時間の代表値を算出する(S206)。DNS応答時間とは、対象トラフィック内のDNS検索の解析から計算したDNS検索からDNS応答までの時間である。   Subsequent to step S205, the traffic information extraction unit 12 calculates the representative value of the DNS response time by executing the following steps S206-1 to S206-3 (S206). The DNS response time is the time from the DNS search to the DNS response calculated from the DNS search analysis in the target traffic.

ステップS206−1において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、対象トラフィックに対してのDNS−RTTデータ集合を抽出する。   In step S206-1, the traffic information extraction unit 12 extracts a DNS-RTT data set for the target traffic for each aggregation unit time τ of trial i.

ステップS206−2において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、抽出されたDNS−RTTデータ集合について、dnst_p1分位点の値を算出する。なお、ステップS206−1では、κ個のDNS−RTTデータ集合が抽出されている。したがって、ステップS206−2では、κ個のdnst_p1分位点の値の組が算出される。なお、dnst_p1及び以下のdnst_p2は、事前設定パラメータの一つであり、DNS応答時間抽出閾値を分位点(例えば、0.9,0.8等)で指定する値である。   In step S206-2, the traffic information extraction unit 12 calculates the value of the dnst_p1 quantile for the extracted DNS-RTT data set for each aggregation unit time τ of trial i. In step S206-1, κ DNS-RTT data sets are extracted. Therefore, in step S206-2, a set of values of κ dnst_p1 quantiles is calculated. Note that dnst_p1 and the following dnst_p2 are one of the preset parameters, and are values that specify the DNS response time extraction threshold value with a quantile (for example, 0.9, 0.8, etc.).

ステップS206−3において、トラフィック情報抽出部12は、κ個のdnst_p1分位点の値のdnst_p2分位点の値を算出する。このdnst_p2分位点の値が、DNS応答時間(DNS−RTT)の代表値(以下、「Drt1_z」という(zは1..Z)。)である。   In step S206-3, the traffic information extraction unit 12 calculates the value of the dnst_p2 quantile of the κ dnst_p1 quantile values. The value of the dnst_p2 quantile is a representative value of DNS response time (DNS-RTT) (hereinafter referred to as “Drt1_z” (z is 1. Z)).

ステップS206に続いて、トラフィック情報抽出部12は、以下のステップS207−1〜S207−3を実行することにより、DNS応答率の代表値を算出する(S207)。DNS応答率とは、モニタ対象トラフィック内のDNS検索の解析から計算したDNS検索に対し応答が有った比率である。   Following step S206, the traffic information extraction unit 12 calculates the representative value of the DNS response rate by executing the following steps S207-1 to S207-3 (S207). The DNS response rate is a ratio of responses to the DNS search calculated from the DNS search analysis in the monitored traffic.

ステップS207−1において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、対象トラフィックに対してのDNS検索数と当該検索に対するDNS応答の数とを抽出する。なお、応答は、τより後の時間になる場合もあるため、dns_timeout経過時までを集計対象とする。dns_timeoutは、事前設定パラメータの一つであり、DNS応答率算出時のタイムアウト時間である。   In step S207-1, the traffic information extraction unit 12 extracts the number of DNS searches for the target traffic and the number of DNS responses to the search for each aggregation unit time τ of trial i. In addition, since the response may be a time later than τ, the time until dns_timeout elapses is counted. dns_timeout is one of the preset parameters, and is a timeout time when calculating the DNS response rate.

ステップS207−2において、トラフィック情報抽出部12は、試行iの集計単位時間τごとに、応答率(DNS応答数/DNS検索数)を算出する。検索数が0のτについては値なしとする。なお、ステップS207−2では、κ個の応答率が算出される。したがって、κ個の応答率の組が得られる。   In step S207-2, the traffic information extraction unit 12 calculates a response rate (number of DNS responses / number of DNS searches) for each aggregation unit time τ of trial i. There is no value for τ where the number of searches is 0. In step S207-2, κ response rates are calculated. Therefore, a set of κ response rates is obtained.

ステップS207−3において、トラフィック情報抽出部12は、κ個の応答率の組から「値なし」のものがあれば除外し、κ個(除外してκ未満のこともある)の値のdnsr_p分位点の値を算出する。dnsr_pは、事前設定パラメータの一つであり、DNS応答率抽出閾値を分位点(例えば、0.2等)で指定する値である。このdnsr_p分位点の値が、DNS応答率の代表値(以下、「Drp1_z」という(zは1..Z)。)である。   In step S207-3, the traffic information extracting unit 12 excludes any “no value” from the set of κ response rates, and dnsr_p of κ (may be less than κ). Calculate the quantile value. dnsr_p is one of the preset parameters, and is a value that designates the DNS response rate extraction threshold using a quantile (for example, 0.2). The value of this dnsr_p quantile is a representative value of the DNS response rate (hereinafter referred to as “Drp1_z” (z is 1.... Z)).

ステップS202〜S207は、Z回の全ての試行について実行される(S208、S209)。その結果、スループット代表値Th1として、以下のようなベクトルが得られる。
Th1=(Th_1,Th1_2,Th1_3…Th1_z)
なお、thpt_p1,thpt_p2の組が、複数設定されてもよい。その場合、当該組毎に、Th2_z,Th3_z等のベクトルが得られる。
Steps S202 to S207 are executed for all Z trials (S208, S209). As a result, the following vector is obtained as the throughput representative value Th1.
Th1 = (Th_1, Th1_2, Th1_3... Th1_z)
A plurality of sets of thpt_p1 and thpt_p2 may be set. In that case, vectors such as Th2_z and Th3_z are obtained for each group.

また、高RTT代表値Rtt1として、以下のようなベクトルが得られる。
Rtt1=(Rtt1_1,Rtt1_2,…Rtt1_z)
なお、rtt_p1,rtt_p2の組が、複数設定されてもよい。その場合、当該組ごとに、Rtt2_z,Rtt3_z等のベクトルが得られる。
Further, as the high RTT representative value Rtt1, the following vector is obtained.
Rtt1 = (Rtt1_1, Rtt1_2,... Rtt1_z)
A plurality of sets of rtt_p1 and rtt_p2 may be set. In that case, vectors such as Rtt2_z and Rtt3_z are obtained for each group.

また、再送率代表値Ret1として、以下のようなベクトルが得られる。
Ret1=(Ret1_1,Ret1_2,…Ret1_z)
なお、ret_pについて、複数の値が設定されてもよい。その場合、当該値ごとに、Ret2_z,Ret3_z等のベクトルが得られる。
Further, the following vector is obtained as the retransmission rate representative value Ret1.
Ret1 = (Ret1_1, Ret1_2,... Ret1_z)
A plurality of values may be set for ret_p. In that case, vectors such as Ret2_z and Ret3_z are obtained for each value.

また、DNS応答時間代表値Drt1として、以下のようなベクトルが得られる。
Drt1=(Drt1_1,Drt1_2,…Drt1_z)
なお、dnst_p1、dnst_p2の組が複数設定されてもよい。その場合、当該組ごとに、Drt2_z,Drt3_z等のベクトルが得られる。
Further, as the DNS response time representative value Drt1, the following vector is obtained.
Drt1 = (Drt1_1, Drt1_2, ... Drt1_z)
A plurality of sets of dnst_p1 and dnst_p2 may be set. In that case, vectors such as Drt2_z and Drt3_z are obtained for each group.

更に、DNS応答率Drp1として、以下のようなベクトルが得られる。
Drp1=(Drp1_1,Drp1_2,…Drp1_z)
なお、dnsr_pについて、複数の値が設定されてもよい。その場合、当該値ごとに、Drp2_z、Drp3_z等のベクトルが得られる。
Furthermore, the following vectors are obtained as the DNS response rate Drp1.
Drp1 = (Drp1_1, Drp1_2,... Drp1_z)
A plurality of values may be set for dnsr_p. In that case, vectors such as Drp2_z and Drp3_z are obtained for each value.

続いて、トラフィック情報抽出部12は、それぞれが長さZの上記各代表値のベクトルを組(行列)として、以下のDPIvecを出力する(S210)。
DPIvec=(Th1(,Th2,Th3..),Rtt1(,Rtt2,Rtt3..),Ret1(,Ret2,Ret3..),Drt1(,Drt2,Drt3),Drp1(,Drp2,Drp3..))
なお、(,Th2,Th3..)、(,Rtt2,Rtt3..)、(,Ret2,Ret3..)、(,Drt2,Drt3)及び(,Drp2,Drp3..)は、事前設定パラメータとしての閾値(分位点)の組の数によって、構成するベクトルの数が変化することを示す。
Subsequently, the traffic information extraction unit 12 outputs the following DPIvec with each vector of the representative values having a length Z as a set (matrix) (S210).
DPIvec = (Th1 (, Th2, Th3 ..), Rtt1 (, Rtt2, Rtt3 ..), Ret1 (, Ret2, Ret3 ..), Drt1 (, Drt2, Drt3), Drp1 (, Drp2, Drp3 ..) )
(, Th2, Th3 ...), (, Rtt2, Rtt3 ...), (, Ret2, Ret3 ...), (, Drt2, Drt3) and (, Drp2, Drp3 ...) are preset parameters. This indicates that the number of constituent vectors changes depending on the number of threshold values (quantile points).

続いて、学習段階において品質推定部13が実行する処理手順について説明する。図5は、学習段階において品質推定部13が実行する処理手順の一例を説明するためのフローチャートである。   Then, the process procedure which the quality estimation part 13 performs in a learning stage is demonstrated. FIG. 5 is a flowchart for explaining an example of a processing procedure executed by the quality estimation unit 13 in the learning stage.

ステップS301において、品質推定部13は、web劣化分析部11によって算出された、m+n+1個の長さZの以下の論理値ベクトルである劣化度論理値Db_(z,s)を入力する。
Db_(z,s)=(Db_(z,−m),Db_(z,−m+1),…Db_(z,n−1),Db_(z,n))
なお、Db_(z,s)は、sを固定すると要素数Z個のベクトルである。sはm+n+1個の値を取るので、Db_(z,s)は、m+n+1個のZ個のベクトルを要素とするベクトルとなる。
In step S301, the quality estimation unit 13 inputs the deterioration degree logical value Db_ (z, s), which is the following logical value vector of m + n + 1 lengths Z calculated by the web deterioration analysis unit 11.
Db_ (z, s) = (Db_ (z, −m), Db_ (z, −m + 1),... Db_ (z, n−1), Db_ (z, n))
Note that Db_ (z, s) is a vector having Z elements when s is fixed. Since s takes m + n + 1 values, Db_ (z, s) is a vector whose elements are m + n + 1 Z vectors.

続いて、品質推定部13は、トラフィック情報抽出部12によって出力された、以下の代表値のベクトルの組(行列)を入力する(S302)。
DPIvec=(Th1(,Th2,Th3..),Rtt1(,Rtt2,Rtt3..),Ret1(,Ret2,Ret3..),Drt1(,Drt2,Drt3),Drp1(,Drp2,Drp3..))
続いて、品質推定部13は、m+n+1個(すなわち、1以上)の推定器のインスタンスを生成する(S303)。すなわち、劣化判定閾値Tsh_sの数と同数の(劣化判定閾値Tsh_sごとの)推定器が用意される。各推定器を「S_s」と表記する。ここで、sは、m+n+1種類のTsh_sに対応する。
Subsequently, the quality estimation unit 13 inputs the following set of representative value vectors (matrix) output by the traffic information extraction unit 12 (S302).
DPIvec = (Th1 (, Th2, Th3 ..), Rtt1 (, Rtt2, Rtt3 ..), Ret1 (, Ret2, Ret3 ..), Drt1 (, Drt2, Drt3), Drp1 (, Drp2, Drp3 ..) )
Subsequently, the quality estimation unit 13 generates m + n + 1 (that is, one or more) instances of the estimator (S303). That is, as many estimators as the number of deterioration determination threshold values Tsh_s (for each deterioration determination threshold value Tsh_s) are prepared. Each estimator is denoted as “S_s”. Here, s corresponds to m + n + 1 types of Tsh_s.

続いて、品質推定部13は、Db_(z,s)を目的変数とし、DPIvecを説明変数として、各S_sを学習させる(S304)。なお、各S_sは、sが共通するDb_(z,s)について学習を行う。これでS_sは学習済みとなり、webページの表示待ち時間の品質の推定に用いることが可能な状態となる。   Subsequently, the quality estimator 13 learns each S_s using Db_ (z, s) as an objective variable and DPIvec as an explanatory variable (S304). Each S_s learns about Db_ (z, s) with common s. S_s is now learned, and can be used to estimate the quality of the display latency of the web page.

続いて、推定段階において推定装置10が実行する処理手順について説明する。図6は、推定段階において推定装置10が実行する処理手順の一例を説明するためのフローチャートである。   Then, the process procedure which the estimation apparatus 10 performs in an estimation stage is demonstrated. FIG. 6 is a flowchart for explaining an example of a processing procedure executed by the estimation apparatus 10 in the estimation stage.

図6の処理手順の前提として、推定対象のエリア及び時間帯に対応するトラフィック計測データD2(例えば、DPIのログデータ)が収集されているとする。当該トラフィック計測データD2を、以下「推定対象計測データ」という。なお、webページの表示待ち時間の計測は不要である。当該表示待ち時間の劣化の度合いが目的変数(推定対象)だからである。   As a premise of the processing procedure of FIG. 6, it is assumed that traffic measurement data D2 (for example, DPI log data) corresponding to the estimation target area and time zone is collected. The traffic measurement data D2 is hereinafter referred to as “estimation target measurement data”. It is not necessary to measure the display wait time of the web page. This is because the degree of deterioration of the display waiting time is an objective variable (estimation target).

ステップS401において、トラフィック情報抽出部12は、推定対象計測データを入力する。続くステップS402〜S406において、トラフィック情報抽出部12は、図4のステップS203〜S207と同様の処理を実行して、推定対象計測データから各代表値を算出(抽出)する。但し、推定対象のエリア及び時間帯は1つであるため、Z=1である。   In step S401, the traffic information extraction unit 12 inputs estimation target measurement data. In subsequent steps S402 to S406, the traffic information extraction unit 12 calculates (extracts) each representative value from the estimation target measurement data by executing the same processing as in steps S203 to S207 of FIG. However, since the estimation target area and the time zone are one, Z = 1.

その結果、トラフィック情報抽出部12は、図5のステップS210と同様に、長さZ=1である、DPIvecと同じ形式の行列を得る。以下、当該行列を「DPIvec_new」という。   As a result, the traffic information extraction unit 12 obtains a matrix of the same format as DPIvec, with a length Z = 1, as in step S210 of FIG. Hereinafter, the matrix is referred to as “DPIvec_new”.

続いて、品質推定部13は、以下のように、各S_s(各推定器)に対してDPIvec_newを入力することで、各劣化判定閾値Tsh_sに応じた、劣化か否かの論理値の組(ベクトル)であるEst_sを得る(S407)
(複数のsに対し)Est_s=S_s(DPIvec_new)
なお、Est_sは、m+n+1の長さの論理値の組(ベクトル)となる。
Subsequently, the quality estimation unit 13 inputs DPIvec_new to each S_s (each estimator) as follows, and thereby sets of logical values indicating whether or not the degradation is in accordance with each degradation determination threshold value Tsh_s ( Est_s which is a vector) is obtained (S407).
Est_s = S_s (DPIvec_new) (for multiple s)
Est_s is a set (vector) of logical values having a length of m + n + 1.

典型的には、Tsh_sの値が最大のsについて真(劣化)であり、Tsh_sが順に小さくなるようsを変えていくと、或るsがθであるときに偽(非劣化)となり、それ以下のTsh_sでは全部偽(非劣化)というパターンとなる(但し、全部偽、全部真、又は順番が壊れていることも起こりうる。)。   Typically, the value of Tsh_s is true (deteriorated) for the largest s, and when s is changed so that Tsh_s decreases in order, it becomes false (non-degraded) when a certain s is θ, In the following Tsh_s, the pattern is all false (non-degraded) (however, all false, all true, or the order may be broken).

品質推定部13は、Est_sからこのようなθを探索し、探索されたθに対応したTsh_θを「推定された劣化度」(推定対象のエリア及び時間帯に対する劣化度の推定値)として出力する(S409)。具体的には、例えば、全部偽(非劣化)であれば、品質推定部13は、「非劣化」と出力する。この場合、(最少の)Tsh_s未満の劣化となる。また、全部真(劣化)であれば、品質推定部13は、「(最大の)Tsh_s以上」を出力する。また、全部偽でなく、かつ、全部真でない場合、偽と真とが、或るTsh_sを境に区分されていない場合でも、品質推定部13は、Tsh_sが大きい側から順に値を確認し、最初に偽となったTsh_θを使い「Tsh_θ以上」を出力する。このTsh_θは(個別のwebページのみには依存しない)webページの表示待ち時間の劣化発生の度合の推定結果である。   The quality estimation unit 13 searches for such θ from Est_s, and outputs Tsh_θ corresponding to the searched θ as an “estimated degradation level” (estimated degradation level for the estimation target area and time zone). (S409). Specifically, for example, if all are false (non-degraded), the quality estimation unit 13 outputs “non-degraded”. In this case, the degradation is less than (minimum) Tsh_s. If all are true (deterioration), the quality estimation unit 13 outputs “(maximum) Tsh_s or more”. In addition, when all are not false and all are not true, even if false and true are not classified with a certain Tsh_s as a boundary, the quality estimation unit 13 checks the values in order from the side with the largest Tsh_s, Using Tsh_θ that becomes false first, “Tsh_θ or more” is output. This Tsh_θ is an estimation result of the degree of occurrence of deterioration of the display latency of the web page (which does not depend only on the individual web page).

なお、本実施の形態では、通信トラフィックの状況を示すパラメータを抽出するパラメータの一例として、低スループット代表値、高RTT代表値、再送率代表値、DNS応答時間代表値、及びDNS応答率代表値を用いる例を説明したが、必ずしもこれら全部が用いられなくてもよく、これらの一部(例えば、いずれか一つ)が用いられてもよい。また、通信トラフィックの状況を把握可能なパラメータであれば、これら以外のパラメータが用いられてもよい。   In this embodiment, as an example of a parameter for extracting a parameter indicating the state of communication traffic, a low throughput representative value, a high RTT representative value, a retransmission rate representative value, a DNS response time representative value, and a DNS response rate representative value However, all of these may not necessarily be used, and some (for example, any one) of them may be used. In addition, parameters other than these may be used as long as the parameters can grasp the status of communication traffic.

上述したように、本実施の形態によれば、webページの表示待ち時間の計測値と、当該表示待ち時間の計測のエリア及び時間帯に対応する通信トラフィックに関する情報との関係を推定器に学習させ、推定したい未知データの通信トラフィックに関する情報を当該推定器に入力することで(個別ページのみには依存しない)webページの待ち時間の劣化の程度を推定することができる。したがって、本実施の形態によれば、個別のwebページの影響が除去された表示待ち時間の品質の推定を可能とすることができる。   As described above, according to the present embodiment, the estimator learns the relationship between the measurement value of the display latency of the web page and the information related to the communication traffic corresponding to the display latency measurement area and the time zone. Then, by inputting information related to communication traffic of unknown data to be estimated to the estimator, it is possible to estimate the degree of deterioration of the waiting time of the web page (which does not depend only on the individual page). Therefore, according to the present embodiment, it is possible to estimate the quality of the display waiting time from which the influence of individual web pages is removed.

また、本実施の形態では、複数のwebページ・サーバを学習に用い、また「webページの表示待ち時間の劣化」という一般的特性を(ネットワーク起因でなくwebページ側の理由等で)一部だけ劣化するものの影響を除外して抽出するために、webページごとの基準で正規化した「劣化度」の考え方、及び複数の計測データの分位点によりデータを抽出する手法を用いることで、個別webページ毎の待ち時間の差を吸収してwebページの待ち時間の劣化を捉える。したがって、webページ・サーバが千差万別であり、同じ時間・場所で利用していても個々のページにより待ち時間は異なるといった問題を解消することができる。   Further, in this embodiment, a plurality of web page servers are used for learning, and a general characteristic of “deterioration of display latency of web pages” is partially (because of the reason of the web page side instead of network origin). In order to extract by excluding the influence of what deteriorates only, by using the concept of “degradation degree” normalized by the standard for each web page and the method of extracting data by the quantile of multiple measurement data, By absorbing the difference in waiting time for each individual web page, the deterioration of the waiting time of the web page is captured. Therefore, it is possible to solve the problem that the web page server is various and the waiting time varies depending on each page even if the web page server is used at the same time and place.

また、本実施の形態では、パッシブ計測データ(ユーザ・通信相手・目的もバラバラの通信データ解析ログ(DPIのログ))の内容の不安定性に対し、(表示待ち時間の劣化時に対応するログも劣化しているなど)劣化情報と対応性が良く、極端な異常値に左右されにくいトラフィックデータの分位点を抽出することで、平均値等を抽出する場合と比較して、斯かる不安定性に適切に対応することができる。   In the present embodiment, in response to instability of the contents of passive measurement data (communication data analysis log (DPI log) with different users, communication partners, and purposes), there is also a log corresponding to the deterioration of the display waiting time. This is instability compared with the case of extracting the average value etc. by extracting the traffic data quantile, which has good compatibility with deterioration information and is not easily influenced by extreme abnormal values. Can respond appropriately.

また、同じNW劣化影響下でも個別webページごとに表示待ち時間の劣化への影響の出方が異なるが、本実施の形態では、複数の対象webページを一括して扱い、その統計量で評価することで「典型的な劣化影響の出方」として定量化することが出来る。また、一般に劣化判定は二値(論理値)で行う。本実施の形態でも論理値の推定器を用いるが、本実施の形態では「劣化度」として定量的な値を用いるため、学習時の論理値ベクトルに変換する際に(複数の劣化レベルに対応した)複数用意し、それぞれ異なるレベルの推定器を用意することで、劣化度合いの判定も併せて実現することができる
なお、本実施の形態において、web劣化分析部11は、算出部及び比較部の一例である。トラフィック情報抽出部12は、取得部の一例である。品質推定部13は、学習部及び推定部の一例である。
In addition, in the present embodiment, a plurality of target web pages are handled in a lump and evaluated by their statistics, although the influence on the display latency degradation differs for each individual web page even under the same NW degradation effect. By doing so, it can be quantified as “typical appearance of degradation effect”. In general, deterioration determination is performed with binary values (logical values). In this embodiment, a logical value estimator is also used. However, in this embodiment, since a quantitative value is used as the “degradation degree”, when converting to a logical value vector during learning (corresponding to a plurality of deterioration levels) By preparing a plurality of estimators having different levels, it is possible to realize the determination of the degree of deterioration. In this embodiment, the web deterioration analysis unit 11 includes a calculation unit and a comparison unit. It is an example. The traffic information extraction unit 12 is an example of an acquisition unit. The quality estimation unit 13 is an example of a learning unit and an estimation unit.

以上、本発明の実施の形態について詳述したが、本発明は斯かる特定の実施形態に限定されるものではなく、特許請求の範囲に記載された本発明の要旨の範囲内において、種々の変形・変更が可能である。   Although the embodiments of the present invention have been described in detail above, the present invention is not limited to such specific embodiments, and various modifications can be made within the scope of the gist of the present invention described in the claims. Deformation / change is possible.

10 推定装置
11 web劣化分析部
12 トラフィック情報抽出部
13 品質推定部
100 ドライブ装置
101 記録媒体
102 補助記憶装置
103 メモリ装置
104 CPU
105 インタ段階装置
B バス
DESCRIPTION OF SYMBOLS 10 Estimation apparatus 11 Web deterioration analysis part 12 Traffic information extraction part 13 Quality estimation part 100 Drive apparatus 101 Recording medium 102 Auxiliary storage apparatus 103 Memory apparatus 104 CPU
105 Inter stage device B bus

Claims (7)

地域及び時間帯の少なくともいずれか一方が異なる複数回の試行ごとに、webページの表示待ち時間の計測データに基づいて、前記表示待ち時間の品質を示す指標の代表値を算出する算出部と、
前記試行ごとに、当該試行に係る前記代表値について、閾値との比較結果を示す論理値を出力する比較部と、
前記試行ごとに、当該試行に係る地域及び時間帯のそれぞれにおける通信トラフィックの状況を示すパラメータを取得する取得部と、
前記各試行の前記論理値を目的変数とし、前記各試行の前記パラメータを説明変数として推定器を学習させる学習部と、
或る地域及び時間帯における前記パラメータを前記推定器に入力して、前記地域及び時間帯におけるwebページの表示待ち時間の品質を推定する推定部と、
を有することを特徴とする推定装置。
A calculation unit that calculates a representative value of the index indicating the quality of the display waiting time based on the measurement data of the display waiting time on the web page for each of a plurality of trials in which at least one of the region and the time zone is different.
For each trial, for the representative value related to the trial, a comparison unit that outputs a logical value indicating a comparison result with a threshold value;
For each trial, an acquisition unit that obtains parameters indicating the status of communication traffic in each of the regions and time zones involved in the trial;
A learning unit that learns the estimator using the logical value of each trial as an objective variable and the parameter of each trial as an explanatory variable;
An estimation unit that inputs the parameters in a certain region and time zone to the estimator and estimates the quality of display latency of the web page in the region and time zone;
The estimation apparatus characterized by having.
前記算出部は、前記試行ごとに、複数のwebページのそれぞれの表示待ち時間の計測データに基づいて、前記webページの表示待ち時間の品質を示す指標の代表値を算出する、
ことを特徴とする請求項1記載の推定装置。
The calculation unit, for each trial, calculates a representative value of an index indicating the quality of display latency of the web page based on measurement data of display latency of each of a plurality of web pages.
The estimation apparatus according to claim 1.
前記比較部は、前記試行ごとに、当該試行に係る前記代表値について、複数の閾値との比較結果を示す論理値群を出力し、
前記学習部は、前記各試行の前記論理値群を目的変数とし、前記各試行の前記パラメータを説明変数として、前記複数の閾値のそれぞれに対応する複数の推定器を学習させ、
前記推定部は、或る地域及び時間帯における前記パラメータを前記複数の閾値のそれぞれに対応する前記推定器に入力して、前記地域及び時間帯におけるwebページの表示待ち時間の品質を推定する、
ことを特徴とする請求項1又は2記載の推定装置。
For each trial, the comparison unit outputs a logical value group indicating a comparison result with a plurality of threshold values for the representative value related to the trial,
The learning unit uses the logical value group of each trial as an objective variable, the parameter of each trial as an explanatory variable, and learns a plurality of estimators corresponding to each of the plurality of threshold values,
The estimation unit inputs the parameter in a certain region and time zone to the estimator corresponding to each of the plurality of thresholds, and estimates the quality of the display waiting time of the web page in the region and time zone.
The estimation apparatus according to claim 1 or 2, wherein
前記取得部は、前記時間帯を分割する複数の単位時間ごとに前記パラメータを取得し、単位時間ごとに取得されたパラメータの代表値を算出し、
前記学習部は、前記各試行の前記論理値を目的変数とし、前記各試行の前記パラメータの代表値を説明変数として推定器を学習させる、
ことを特徴とする請求項1乃至3いずれか一項記載の推定装置。
The acquisition unit acquires the parameter for each of a plurality of unit times that divide the time zone, calculates a representative value of the parameter acquired for each unit time,
The learning unit uses the logical value of each trial as an objective variable, and trains an estimator using a representative value of the parameter of each trial as an explanatory variable.
The estimation apparatus according to claim 1, wherein:
前記算出部は、前記試行ごとに、前記webページの表示待ち時間の複数の計測データに基づいて、前記webページの表示待ち時間の品質を示す指標の代表値を算出する、
ことを特徴とする請求項1乃至4いずれか一項記載の推定装置。
The calculation unit calculates a representative value of an index indicating the quality of the display latency of the web page based on a plurality of measurement data of the display latency of the web page for each trial.
The estimation apparatus according to claim 1, wherein:
地域及び時間帯の少なくともいずれか一方が異なる複数回の試行ごとに、webページの表示待ち時間の計測データに基づいて、前記表示待ち時間の品質を示す指標の代表値を算出する算出手順と、
前記試行ごとに、当該試行に係る前記代表値について、閾値との比較結果を示す論理値を出力する比較手順と、
前記試行ごとに、当該試行に係る地域及び時間帯のそれぞれにおける通信トラフィックの状況を示すパラメータを取得する取得手順と、
前記各試行の前記論理値を目的変数とし、前記各試行の前記パラメータを説明変数として推定器を学習させる学習手順と、
或る地域及び時間帯における前記パラメータを前記推定器に入力して、前記地域及び時間帯におけるwebページの表示待ち時間の品質を推定する推定手順と、
をコンピュータが実行することを特徴とする推定方法。
A calculation procedure for calculating a representative value indicating the quality of the display waiting time based on the measurement data of the display waiting time on the web page for each of a plurality of trials in which at least one of the region and the time zone is different.
For each trial, for the representative value related to the trial, a comparison procedure for outputting a logical value indicating a comparison result with a threshold value;
For each trial, an acquisition procedure for obtaining parameters indicating the status of communication traffic in each of the regions and time zones involved in the trial;
A learning procedure for learning an estimator using the logical value of each trial as an objective variable and the parameter of each trial as an explanatory variable;
An estimation procedure for inputting the parameters in a certain region and time zone to the estimator to estimate the quality of display latency of the web page in the region and time zone;
Is performed by a computer.
請求項1乃至5いずれか一項記載の各部としてコンピュータを機能させることを特徴とするプログラム。 6. A program that causes a computer to function as each unit according to claim 1.
JP2017202490A 2017-10-19 2017-10-19 Estimation apparatus, estimation method, and program Active JP6618971B2 (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
JP2017202490A JP6618971B2 (en) 2017-10-19 2017-10-19 Estimation apparatus, estimation method, and program

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
JP2017202490A JP6618971B2 (en) 2017-10-19 2017-10-19 Estimation apparatus, estimation method, and program

Publications (2)

Publication Number Publication Date
JP2019075030A JP2019075030A (en) 2019-05-16
JP6618971B2 true JP6618971B2 (en) 2019-12-11

Family

ID=66545161

Family Applications (1)

Application Number Title Priority Date Filing Date
JP2017202490A Active JP6618971B2 (en) 2017-10-19 2017-10-19 Estimation apparatus, estimation method, and program

Country Status (1)

Country Link
JP (1) JP6618971B2 (en)

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP5957419B2 (en) * 2013-06-27 2016-07-27 日本電信電話株式会社 QoE estimation apparatus, QoE estimation method and program
JP2015106220A (en) * 2013-11-29 2015-06-08 Kddi株式会社 Sensory communication quality estimation device and sensory communication quality estimation program
JP6276240B2 (en) * 2015-11-06 2018-02-07 日本電信電話株式会社 Quality degradation area identification system, quality degradation area identification method, and program

Also Published As

Publication number Publication date
JP2019075030A (en) 2019-05-16

Similar Documents

Publication Publication Date Title
CN108667856B (en) Network anomaly detection method, device, equipment and storage medium
CN105530138B (en) Data monitoring method and device
CN107967488B (en) Server classification method and classification system
JP2008283621A (en) Apparatus and method for monitoring network congestion state, and program
JP2008176753A (en) Data similarity inspection method and device
WO2016038857A1 (en) Number-of-scales estimation apparatus, number-of-scales management system, number-of-scales estimation method, number-of-scales management method, and storage medium
JP6721057B2 (en) Communication session log analysis device and method
JP6691268B2 (en) Monitoring device, monitoring method, and monitoring program
JP2018148350A (en) Threshold determination device, threshold level determination method and program
JP5957419B2 (en) QoE estimation apparatus, QoE estimation method and program
JP2012186667A (en) Network fault detection apparatus, network fault detection method of network fault detection apparatus, and network fault detection program
JP6618971B2 (en) Estimation apparatus, estimation method, and program
EP3593493B1 (en) Prediction of a performance indicator
CN107438268B (en) Method and device for accelerating wireless network for mobile device
JP7052575B2 (en) Judgment device, judgment method and judgment program
JP4927180B2 (en) User waiting time estimation apparatus, user waiting time estimation method, and program
JP6418638B2 (en) Communication identification method and apparatus
JP6589223B2 (en) Service estimation apparatus, service estimation method, and program
JP2010068367A (en) Device for monitoring network performance
CN114039745B (en) Method, equipment and medium for identifying abnormal traffic of website
JP7070678B2 (en) Communication analyzer, communication analysis method, communication environment analyzer, communication environment analysis method, and program
JP4209897B2 (en) Mass flow generation host identification method and system
US20170078178A1 (en) Delay information output device, delay information output method, and non-transitory computer-readable recording medium
JP6280092B2 (en) Estimation apparatus and estimation method
JP6698507B2 (en) Communication monitoring device, communication monitoring method, and communication monitoring program

Legal Events

Date Code Title Description
A621 Written request for application examination

Free format text: JAPANESE INTERMEDIATE CODE: A621

Effective date: 20190129

A977 Report on retrieval

Free format text: JAPANESE INTERMEDIATE CODE: A971007

Effective date: 20191029

TRDD Decision of grant or rejection written
A01 Written decision to grant a patent or to grant a registration (utility model)

Free format text: JAPANESE INTERMEDIATE CODE: A01

Effective date: 20191112

A61 First payment of annual fees (during grant procedure)

Free format text: JAPANESE INTERMEDIATE CODE: A61

Effective date: 20191113

R150 Certificate of patent or registration of utility model

Ref document number: 6618971

Country of ref document: JP

Free format text: JAPANESE INTERMEDIATE CODE: R150