LT5869B - Analysis method of computer network traffic in real time - Google Patents

Analysis method of computer network traffic in real time Download PDF

Info

Publication number
LT5869B
LT5869B LT2011099A LT2011099A LT5869B LT 5869 B LT5869 B LT 5869B LT 2011099 A LT2011099 A LT 2011099A LT 2011099 A LT2011099 A LT 2011099A LT 5869 B LT5869 B LT 5869B
Authority
LT
Lithuania
Prior art keywords
network traffic
time
analysis
real
parameters
Prior art date
Application number
LT2011099A
Other languages
Lithuanian (lt)
Other versions
LT2011099A (en
Inventor
Liudvikas Kaklauskas
Leonidas Sakalauskas
Original Assignee
Šiaulių universitetas
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Šiaulių universitetas filed Critical Šiaulių universitetas
Priority to LT2011099A priority Critical patent/LT5869B/en
Publication of LT2011099A publication Critical patent/LT2011099A/en
Publication of LT5869B publication Critical patent/LT5869B/en

Links

Landscapes

  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

The invention relates to the digital information systems for monitoring and testing of computer networks using packet data transmission and network traffic analysis for real time. Analysis method of computer network traffic in real-time allows to select the network traffic aggregation method and parameters, and is characterized by fault – tolerance and high speed computing. The invention is characterized that at real time is fixed network traffic, are formed time series, which are aggregated using moving average smoothing or method of sum of transfer dates flow by time interval. Line, which is stored in a temporary memory, constantly supplemented with new members. Singularity of line introduces by recuperating method using robastic method of empirical quintile regression, IR statistic, R/S statistic. For evaluation of singularity network traffic is proposed to calculate ? stability index, IR estimation and Hurst coefficient.

Description

Išradimas priskiriamas skaitmeninės informacijos stebėjimo ir testavimo sistemoms, kai kompiuterių tinkluose naudojamas paketinis duomenų perdavimas ir skirtas tinklo srauto analizei realiu laiku.BACKGROUND OF THE INVENTION The present invention relates to systems for monitoring and testing digital information when computer networks use packet data transmission for real-time network traffic analysis.

Perduodant kompiuterių tinklais informaciją svarbu, kad siuntėjo išsiųsti duomenų paketai sėkmingai pasiektų gavėją. Kiekvienam kompiuterių tinklo vartotojui paslauga suteikiama tuoj pat po jos pareikalavimo, todėl atskiruose tinklo segmentuose dažnai atsiranda nenumatytos tinklo perkrovos, sąlygojančios duomenų praradimus tinkle. Siekiant užtikrinti duomenų perdavimo patikimumą rekomenduojama kompiuterių tinkle prognozuoti tinklo segmentų perkrovas ir imtis veiksmų, mažinančių perduodamos informacijos praradimus.When transmitting information over computer networks, it is important that the data packets sent by the sender reach the recipient successfully. Each user on a computer network is provided with the service immediately upon request, which often results in unexpected network congestion in individual network segments resulting in data loss on the network. In order to ensure the reliability of data transmission, it is recommended to forecast congestion of network segments in the computer network and to take steps to reduce the loss of transmitted information.

Yra žinomas duomenų srauto pliūpsniškumo analizės realiu laiku būdas (žiūr. patentą US5343465), kai fiksuojamas duomenų paketo atėjimo į sistemą laikas taip formuojant laiko eilutes, kurioms realiu laiku yra skaičiuojami aprašomosios statistikos parametrai: variacijos koeficientas, koreliacijos koeficientas, dispersijos koeficientas. Dispersijos koeficientas charakterizuoja srauto pliūpsniškumą. Šis techninis sprendimas nepateikia srauto savastingumo jverčių.There is a known real-time analysis of data flow creep analysis (see US 5,343,465), which captures the time of data packet entry to form time series for which descriptive statistics parameters are calculated in real time: coefficient of variation, correlation coefficient, dispersion coefficient. The dispersion coefficient characterizes the flow creep. This technical solution does not provide estimates of the specificity of the flow.

Kitame patente (žiūr. patentą WO1999040703) tinklo srauto analizei realiu laiku naudoja suformuotų laiko eilučių bangelių analizės būdą. Trūkumas - šiame išradime naudojamas tik vienas srauto analizės ir vienas agregavimo metodas.In another patent (see patent WO1999040703), a real-time network waveform analysis is used for real-time network traffic analysis. Disadvantage - The present invention employs only one flow analysis and one aggregation method.

Yra žinomas patentas (žiūr. patentą EP 1983687), kuriame siūlo savastingumo laipsnį matuoti dinamiškai skaičiuojant srauto Hurst koeficientą. Pirmas koeficientas apskaičiuojamas iš pirmos laiko eilutės, kuri suformuota skaičiavimo modulyje iš realių duomenų sekos, o kiti gaunami prie einamosios pridėjus naują narį ir apskaičiavus naują Hurst koeficientą iš naujai gautos laiko eilutės pradedant antruoju nariu. Skaičiavimams naudojama R/S statistika, laiko dispersijos, liekanos dispersijos, laiko absoliutinių momentų, siaurinimo (angį. vvhittles) didžiausio tikėtinumo, signalo bangelių įverčių, įterptojo šakojimo, betrendės fliuktuacijos analizės metodai. Šiame išradime neatliekamas eilučių agregavimas.There is a known patent (see EP 1983687) which proposes to measure the degree of self-property by dynamically calculating the flow Hurst coefficient. The first coefficient is calculated from the first time series formed in the computation module from the real data sequence, while the others are obtained by adding a new member to the current one and calculating the new Hurst coefficient from the newly obtained time series starting with the second member. The calculations use R / S statistics, methods for analysis of time variance, residual dispersion, time absolute moments, peak vvhittles, signal wave estimates, embedded branching, immature fluctuation. The present invention does not perform string aggregation.

Taip pat žinomas būdas ir tinklo srauto analizės įrenginys (žiūr. patentą EP1780955), kuriame tinklo srauto analizei formuojama 1000 narių laiko eilutė, kuri vėliau papildoma naujais nariais, išsaugant tą patį eilutės ilgį. Eilutė formuojama buferyje, kuriame skaičiuojama R/S statistika, laiko dispersija, liekanos dispersija, laiko absoliutiniai momentai, siaurinimo didžiausias tikėtinumas, įvertinamos signalo bangelės, taikomi įterptojo šakojimo bei betrendės fliuktuacijos analizės metodai. Rezultatai klasifikuojami ir saugomi išeities buferyje.Also known is a network traffic analyzer (see EP1780955), which generates a 1000-member time series for network traffic analysis, which is then supplemented with new members while maintaining the same line length. The row is formed in a buffer that calculates R / S statistics, time dispersion, residual dispersion, time absolute moments, maximum likelihood of narrowing, signal waves, embedded branching and immature fluctuation analysis methods. Results are classified and stored in the output buffer.

Šio išradimo trūkumas toks, kad matavimams negalima naudoti kelių skirtingų agregavimo metodų, o Hurst koeficientai nesaugomi tolesnei analizei.A disadvantage of the present invention is that several different aggregation methods cannot be used for the measurements, and the Hurst coefficients are not stored for further analysis.

Šio išradimo tikslas padėti įvertinti tinklo perkrovų pasikartojimo galimybę ir priimti sprendimą dėl nereikšmingų srauto dedamųjų apribojimo ar techninės įrangos keitimo. Siūlomas būdas leidžia pasirinkti tinklo srauto agregavimo metodą ir parametrus, pasižymi atsparumu klaidoms bei didele skaičiavimo sparta.The object of the present invention is to assist in the assessment of the possibility of repetition of network congestion and to make a decision on the limitation of minor traffic components or the replacement of hardware. The proposed method allows choosing the method and parameters of network traffic aggregation, it is characterized by error resistance and high computing speed.

Šis tikslas pasiekiamas tuo, kad:This objective is achieved by:

realiu laiku agreguojamas tinklo srautas taikant judančių vidurkių glotninimo metodą arba perduotų duomenų srauto sumos per laiko intervalą metodą;real-time aggregation of network traffic using the smoothing of moving averages method or the sum of transmitted traffic over time;

suformuotą eilutę saugo laikinoje atmintyje;caches the formed string in cache memory;

rekurentiškai skaičiuoja dinamiškai formuojamos eilutės savastingumo parametrus taikant robastinį empirinių kvantilių regresijos metodą, IR statistiką ir R/S statistiką.recursively calculates dynamically formed string self-response parameters using robust empirical quantile regression, IR statistics and R / S statistics.

skaičiavimo rezultatus tolesnei analizei saugo laikinojoje arba/ir pastovioje atmintyje; siūloma skaičiuoti a stabilumo indeksą, IR įvertį ir Hurst koeficientą.storing the calculation results in a cache memory and / or in a read only memory for further analysis; it is suggested to calculate a stability index, IR estimate and Hurst coefficient.

Išradimo esmė paaiškinta brėžiniuose:The essence of the invention is explained in the drawings:

fig. 1 - struktūrinė schema, pagal kurią gali būti realizuotas siūlomas kompiuterių tinklo srauto analizės realiu laiku būdas;FIG. 1 is a flowchart for realizing a proposed real-time analysis of computer network traffic;

fig. 2 - kompiuterių tinklo srauto analizės realiu laiku būdo realizavimo algoritmas.FIG. 2 - realization algorithm for real-time analysis of computer network traffic.

Įrenginio struktūrinė schema, pagal kurią gali būti realizuotas kompiuterių tinklo srauto 25 analizės realiu laiku būdas, parodyta fig.l. Ji susideda iš nuosekliai sujungtų tinklo srauto agregavimo, analizės kriterijų ir parinkčių įvedimo modulio 1, paketų nuskaitymo modulio 2, tinklo paketų antraščių apdorojimo modulio 3, laiko eilutės agregavimo ir formavimo realiu laiku modulio 4, laiko eilučių laikinosios saugyklos 5, laiko eilučių savastingumo analizės modulio 6, skaičiavimo rezultatų formavimo modulio 7 ir skaičiavimo rezultatų saugyklos 8.A block diagram of a device according to which a real-time analysis of computer network traffic 25 can be implemented is shown in FIG. It consists of sequentially interconnected network traffic aggregation, analysis criteria and options entry module 1, packet scanning module 2, network packet header processing module 3, time series aggregation and real time module 4, time series cache 5, time series identity analysis module 6, Computation Output Module 7, and Computation Output Repository 8.

Skaičiavimo rezultatų formavimo modulis 7 papildomai sujungtas su skaičiavimo rezultatų peržiūros sąsaja 9.The calculation result generation module 7 is additionally connected to the calculation result viewer interface 9.

Pradedant tinklo srauto analizę, tinklo srauto agregavimo ir analizės kriterijų bei parinkčių įvedimo modulyje 1 pasirenka vieną iš duomenų srauto agregavimo būdų, parenka srauto analizės metodus, nurodo formuojamos eilutės ilgį, pasirenka laiko eilutės agregavimo intervalą bei nurodo, ar reikia saugoti gautus rezultatus. Šis modulis susijęs su paketų nuskaitymo moduliu 2, skaitančiu duomenų paketus iš kompiuterių tinklo fizinės terpės. Tinklo paketų antraščių apdorojimo modulyje 3 iš paketo antraštės atskiria informaciją, naudojamą agreguotos eilutės formavimui. Pagal įvedimo modulyje 1 pasirinktą agregavimo taikant judančių vidurkių glotninimo metodą arba perduotų duomenų srauto sumos per laiko intervalą metodą ir agregavimo intervalą agregavimo ir formavimo realiu laiku modulyje 4 formuoja laiko eilutę. Suformuota laiko eilutė saugoma laikinojoje saugykloje 5. Suformavus pirmą eilutę, kiekviena sekanti eilutė šioje saugykloje bus formuojama rekurentiškai. Toliau agreguota laiko eilutę perduoda į savastingumo analizės modulį (6), kuriame pagal pasirinktus analizės metodus (robastinį empirinių kvantilių regresijos, IR statistikos ir/arba R/S statistikos) skaičiuoja stabilumo indeksą, IR įvertį ir Hurst koeficientą. Gautus rezultatus perduoda į skaičiavimo rezultatų formavimo modulį 7, iš kur jie nukreipiami į skaičiavimo rezultatų peržiūros sąsają 9. Rezultatai gali būti pateikiami skaitinėje arba grafinėje formoje.At the beginning of network traffic analysis, in the network traffic aggregation and input criteria and options module 1, select one of the data traffic aggregation methods, select flow analysis methods, specify the length of the line to be formed, select the time series aggregation interval and indicate whether the results should be stored. This module relates to packet scanning module 2, which reads data packets from the physical medium of a computer network. The network packet header processing module 3 separates the information used to form an aggregate string from the packet header. According to the method of aggregating using moving averages selected in the Input Module 1 or the sum of the transmitted data stream over the time interval and the aggregation interval in the real time aggregation and shaping module 4, the time series is formed. The formed time series is stored in the cache 5. After the first row is formed, each subsequent row in this repository will be recursively formed. The aggregated time series is then transmitted to the self-analysis module (6), which calculates the stability index, IR estimate and Hurst coefficient according to the chosen analysis methods (robust empirical quantile regression, IR statistics and / or R / S statistics). The obtained results are transmitted to the computation result generation module 7, where they are redirected to the computation result viewer interface 9. The results can be presented in numerical or graphical form.

Jei vartotojas pasirinko saugoti skaičiavimo rezultatus, tai jie gali būti saugomi skaičiavimo rezultatų saugykloje 8.If the user has chosen to store the calculation results, they can be stored in the calculation results repository 8.

Matematinis siūlomo būdo aprašymas.Mathematical description of the proposed approach.

Kompiuterių tinklo analizės metu realiu laiku formuojama laiko eilutė, kuri atitinka matavimus atliktus laiko tarpais /,,/2, čia n - eilutės narių kiekis. Tinklu ateinančių paketų atvykimo laikai t., kur ze[l,«], yra netolyginiai it -* tM -tt, o duomenų paketai atitinkamais laiko tarpais x1,x2,...,xn nusako kanalo užimtumą kiekvienu laiko momentu t.. Norint analizuoti tokią laiko eilutę ją būtina agreguoti, t. y. apskaičiuoti duomenų srautus vienodais laiko tarpais Δ/ = Z. - ί._λ = tM -1.. Duomenų agregavimą galima atlikti dviem būdais:During the analysis of a computer network, a time series is formed in real time, which corresponds to measurements made at intervals / ,, / 2 , where n is the number of members of the line. The packet arrival times t, where ze [l, «] are non-uniform i t - * t M -t t , and the data packets at appropriate times x 1 , x 2 , ..., x n determine the channel occupancy to analyze such a time series it is necessary to aggregate it, ie to calculate data flows at equal intervals Δ / = Z. - ί._ λ = t M -1 .. Data aggregation can be done in two ways:

Pirmuoju būdu - taikant judančių vidurkių glotninimo metodą, kai pasirinktu laiko intervaluThe first is the smoothing of moving averages over a selected time interval

ΔΖ duomenų eilutei apskaičiuojamas vidutinis srautas:Calculate the average flow for the ΔΖ data line:

čia ΔΖ = ZyΛ, y e [1,/1] , kur n- sveikieji skaičiai, k e[l,«] , kur n- sveikieji skaičiai, / ir k tenkina nelygybę j>k .where ΔΖ = Z y −Ζ Λ , ye [1, / 1] where n - integers, ke [l, «] where n - integers, / and k satisfy the inequality j> k.

Gautos laiko eilutės aprašo vidutinius duomenų srauto pokyčius kas laiko momentą ΔΖ. Antruoju būdu - skaičiuojant duomenų srauto per laiko intervalą ΔΖ kiekį:The resulting time series describe the average changes in data traffic at each time point ΔΖ. In the second way, by calculating the amount of data traffic over time interval ΔΖ:

*,Σ=Σ*.« (2) /-y čia ΔΖ = t j - tk, , kur n - sveikieji skaičiai, ke[l,n] , kur n - sveikieji skaičiai, j ir k tenkina nelygybę j> k .*, Σ = Σ *. « (2) / -y where ΔΖ = tj - t k , where n is an integer, ke [l, n] where n is an integer, j and k satisfy the inequality j> k .

Naudojant judančių vidurkių glotninimo metodą agreguotoje eilutėje bus nežymiai sumažinami tinklo srauto pliūpsniai, atsižvelgiant į vartotojo pasirinktą agregavimo intervalą. Taikant perduotų duomenų srauto sumos per laiko intervalą agregavimo metodą, atsižvelgiant į pasirinktą laiko intervalą, bus labiau išryškinami tinklo srauto pliūpsniai.Using the smoothing method of moving averages, the aggregate row will slightly reduce network traffic spikes based on the aggregation interval selected by the user. Applying a method of aggregating the amount of data traffic transmitted over a time interval will give more prominence to network traffic spikes based on the time interval you choose.

Formuojant laiko eilutes analizei galima pasirinkti diskrečius agregavimo intervalus, kuriuos keičiant ir palyginant gautus rezultatus galima įvertinti srauto fraktališkumą. Pasirenkant ΔΖ rekomenduojama atsižvelgti į matuojamo tinklo srauto intensyvumą, t. y. esant intensyvesniam srautui Δζ pasirenkamas mažesnis, priešingu atveju - didesnis.By forming time series for analysis, discrete aggregation intervals can be selected, which can be varied and compared to evaluate the fractality of the flow. When choosing ΔΖ, it is recommended to take into account the measured network traffic intensity, i. y. at higher flow rates Δζ is selected lower, otherwise higher.

Stabiliųjų atsitiktinių dydžių įverčių skaičiavimas.Calculation of estimates of stable random variables.

Yra žinoma, kad savastingasis simetriškas procesas, aprašytas formulėmis ir pasižymintis begaline dispersija, yra vadinamas α-stabiliuoju procesu [Samorodnitsky G, Taqqu MS. Stable Non-Gaussian Processes: Stochastic Models with Infinite Variance // Chapman and Hali: New York, 1994. - P. 636.], jei kiekvienam atsitiktiniam procesui Y(t) galima aprašyti tinklo srauto pliūpsnius pagal formulę:The peculiar symmetric process described by the formulas and characterized by infinite dispersion is known as the α-stable process [Samorodnitsky G, Taqqu MS. Stable Non-Gaussian Processes: Stochastic Models with Infinite Variance // Chapman and Hali: New York, 1994. - P. 636.], if for each random process Y (t) can be described the network traffic bursts according to the formula:

P(| F (Z) |> x) ~ cx~a (3) kur:P (| F (Z) |> x) ~ cx ~ a (3) where:

P - tinklo srauto pliūpsnio pasirodymo tikimybė, t - kintamas dydis, dar vadinamas laiko dedamąja,P is the probability of a network traffic surge, t is a variable, also called a time component,

Y(t) - funkcija, priklausanti nuo laiko, x - skaičius ir x -> oo, c - konstanta ir c > 0, a - stabilumo indeksas.Y (t) is a function of time, x is a number and x -> oo, c is a constant and c> 0, a is a stability index.

Yra įrodyta, kad, kai 1 < a < 2 aukščiau pateiktos formulės vidurkis yra baigtinis, o kai 0 < a < 1 - begalinis [G. Samorodnitsky, Long Range Dependence. Foundations and Trends in Stochastic Systems. Vol. 1, No. 3, 2006, 163-257].It is proved that when 1 <a <2 the mean of the above formula is finite and when 0 <a <1 is infinite [G. Samorodnitsky, Long Range Dependence. Foundations and Trends in Stochastic Systems. Vol. 1, No. 3, 163-257, 2006].

Stabilusis atsitiktinis dydis 5α(β,σ,μ) yra apibūdinamas keturiais stabilumo parametrais:The stable random variable 5 α (β, σ, μ) is characterized by four stability parameters:

a - stabilumo indeksas a e (0,2], dar vadinamas uodegų indeksu, nusakantis proceso pliūpsniškumą, β - asimetrijos indeksas β e [-1,1], nusakantis proceso poslinkį atžvilgiu nulio, σ - mastelio indeksas, σ>0 ir nusako proceso elementų dydį, μ - padėties indeksas μ e R.a is the stability index ae (0,2), also called the tail index, which describes the process creepiness, β is the asymmetry index β e [-1,1], which describes the process offset to zero, σ is the scaling index, σ> 0 and describes the process the size of the elements, μ is the position index μ e R.

Laiko eilutės savastingumo įvertinimui pakanka apskaičiuoti stabilumo indeksą. Likusių trijų stabilumo parametrų skaičiavimas leidžia tik įvertinti eilutės savybes, todėl jų skaičiavimo formulės nėra pateikiamos. Stabiliojo atsitiktinio stabilumo indekso a įvertinimui pasirinkti robastiniai vertinimo metodai, pasižymintys atsparumu klaidoms bei didele skaičiavimo sparta. Plačiau apie tai darbe [L. Kaklauskas, L. Sakalauskas (2011). Study of on-line measurement of traffic self-similarity. Central European Journal of Operations Research, DOI: 10.1007/sl0100011-0216-5].The stability index is sufficient to estimate the self-sufficiency of a time series. The calculation of the remaining three stability parameters only allows estimation of the properties of the string, so their formulas are not given. Robust estimation methods with high error tolerance and high computational speed were chosen for the evaluation of the stable random stability index a. More on this at work [L. Kaklauskas, L. Sakalauskas (2011). Study of on-line measurement of traffic self-similarity. Central European Journal of Operations Research, DOI: 10.1007 / sl0100011-0216-5].

Mūsų siūlomame būde pritaikytas robastinis empirinių kvantilių regresijos metodas . Šis metodas a -stabiliųjų dydžių parametrų įvertinimui pasiūlytas darbe [I. A. Koutrouvelis (1981). An iterative procedure for the estimation of the parameters of the stable law. Communications in Statistics - Simulation and Computation 10, 1981, 17-28]. Šio metodo taikymai plačiau aprašyti darbe [I. Belovas, A.Kabašinskas, L. Sakalauskas, (2005). Vertybinių popierių rinkos stabiliųjų modelių tyrimas. Konferencijos Informacinės technologijos 2005 medžiaga, Technologija,In our proposed approach, a robust empirical quantile regression method is applied. This method for estimating a -stable magnitude parameters is proposed in [I. A. Koutrouvel (1981). An iterative procedure for estimating parameters of stable law. Communications in Statistics - Simulation and Computation 10, 17-28, 1981]. Applications of this method are described in more detail in [I. Belov, A.Kabashinskas, L. Sakalauskas, (2005). Investigation of Stock Market Stable Models. Proceedings of the Conference on Information Technology 2005, Technology,

Kaunas, pp. 439-462].Kaunas, p. 439-462].

Pagal robastinį empirinių kvantilių regresijos metodą stabilumo indeksas apskaičiuojamas pagal formulę:The robust empirical quantile regression method calculates the stability index using the formula:

(4)(4)

S,S,

K kur: KSi = J* , kai K =10, *=i y t =iog(->og(M„Ū*)l2.K where: K Si = J * for K = 10, * = iy t = iog (-> og (M „Ū *) l 2 .

n /=1 n - suformuotos laiko eilutės elementų skaičius, ję - z'-tasis laiko eilutės elementas, t - pasirinktas laiko eilutės agregavimo intervalas, n / = 1 n is the number of elements of the time series formed, if z is the z'th time element, t is the selected time series aggregation interval,

>* = log IG I»> * = log IG I »

K s3=^yk >K s 3 = ^ yk>

A=1A = 1

K $3=2^ ’ *=1K $ 3 = 2 ^ '* = 1

KSi =įyk,teiK=10.K Si = iny k , teiK = 10.

A=1A = 1

Jei gautoji a reikšmė 1 < a < 2, tai eilutė pasižymi savastingumu ir kuo a reikšmė arčiau 2, tuo savastingumo atmintis ilgesnė. Kaip minėta aukščiau, kitų trijų eilutės stabilumo parametrų skaičiavimas leidžia įvertinti eilutės savybes, tačiau apie jos savastingumą papildomos informacijos nepateikia.If the obtained value of a is 1 <a <2, then the string is characterized by self-identity, and the closer the value of a to 2, the longer the memory of self-identity. As mentioned above, the calculation of the other three string stability parameters allows estimating the properties of the string, but provides no additional information about its specificity.

Antras skaičiavimo metodas yra IR statistika (angį. Increment Ratio statistics). Plačiau toks skaičiavimas aprašytas darbe [D. Surgailis, G. Teyssiere, M. Vaičiulis. The increment ratio statistics. Journal of Multivariate Analysis Volume 99, Issue 3, March 2008, pages 510-541], Skaičiuojant šiuo metodu įvertinama, ar analizuojamas tinklo srautas pasižymi savastingumu su ilgalaike atmintimi. Pagal IR statistikos metodą IR įvertis apskaičiuojamas pagal formulę:The second calculation method is IR Statistics (Increment Ratio Statistics). More specifically, such a calculation is described in [D. Surgailis, G. Teyssiere, M. Vaičiulis. The increment ratio statistics. Journal of Multivariate Analysis Volume 99, Issue 3, March 2008, pages 510-541], This method evaluates whether the analyzed network traffic has a feature with long-term memory. According to the IR statistical method, the IR estimate is calculated using the formula:

k+m k+2mk + m k + 2m

IR.-1 n-3m n-3m-lIR.-1 n-3m n-3m-1

ΣΣ

A=0A = 0

Σ<χ»-~χ.'>+ Σ<* i=k+l k+mΣ < χ »- ~ χ . '> + Σ <* i = k + l k + m

Σ<*,...-*3 =A+1 issk+m+1 k+2mΣ <*, ...- * 3 = A + 1 issk + m + 1 k + 2m

Z+m (5)Z + m (5)

Σ<*» i’sft+m+1 kur: A - kintamasis, naudojamas IR įverčio reikšmės skaičiavimui, n - suformuotos eilutės narių skaičius, m = [m1 73 ], o IR įverčio skaičiavimui imama tik m reikšmės sveikoji dalis,Σ <* »i'sft + m + 1 where: A is the variable used to calculate the IR estimate, n is the number of members of the formed string, m = [m 1 73 ], and only the integer portion of the m value is taken to calculate the IR estimate,

X į - z-tasis suformuotos eilutės narys.X to - The z-th member of the formed string.

Su pasikliovimo lygmeniu 0,95 galima teigti, kad agreguota eilutė pasižymi savastingumu su ilgalaike atmintimi, jei tenkinama nelygybė:With a confidence level of 0.95, it is possible to say that an aggregate string has a self-sufficiency with long-term memory if inequality is satisfied:

77?-Λ(0)>ζασ(0)-— (6)77? -Λ (0)> ζ α σ (0) -— (6)

V n-3m kur: A(0) = 0,5881, σ(0) = 0,2080, ^0,95 = 1»64 ,V n-3m where: A (0) = 0.5881, σ (0) = 0.2080, ^ 0.95 = 1 »64,

Hurst koeficientas H skaičiuojamas pagal žinomą R/S statistikų metodiką, pvz., pagal metodiką, aprašytą [G. Samorodnitsky. Long Range Dependence. Foundations and Trends in Stochastic Systems 2006b; 1(3):163 - 257].The Hurst coefficient H is calculated according to a known R / S statistic, e.g., the method described in [G. Samorodnitsky. Long Range Dependence. Foundations and Trends in Stochastic Systems 2006b; 1 (3): 163-257].

Robastinj empirinių kvantilių regresijos metodą rekomenduojama naudoti, kai reikia tiksliau įvertinti tinklo srauto savastingumą ir jo ilgalaikę atmintį, skaičiuojant a indeksą. Klasikinė R/S statistika naudotina kaip gauto a indekso kontrolės priemonė, kuri iš esmės patvirtina tinklo srauto savastingumo savybę. IR statistika rekomenduojama naudoti tada, kai reikia įvertinti kompiuterių tinklo srauto kitimo tendencijas.It is recommended that the robust empirical quantile regression method be used when more accurate estimation of network traffic specificity and its long-term memory is required by computing an index. Classical R / S statistics should be used as a control for the resulting a-index, which essentially confirms the property of network traffic specificity. It is recommended to use IR statistics when evaluating trends in computer network traffic.

Algoritmas, kuris vertina kompiuterių tinklo srauto savastingumą pagal pateiktą būdą, pavaizduotas fig. 2. Pirmas žingsnis - vartotojo parinkčių įrašymas 10 - įvedama informacija apie pasirinktą agregavimo intervalą, agregavimo metodą, formuojamos laiko eilutės ilgį, pasirenkami savastingumo įvertinimo metodai bei rezultatų saugojimas. Antras žingsnis - tinklo paketų skaitymas iš tinklo įrenginio 11. Trečias žingsnis - informacijos iš paketų antraščių nuskaitymas 12. Ketvirtas žingsnis - laiko eilutės agregavimas 13. Jei pasirinktas judančių vidurkių glotninimo metodas 14, tai eilutė formuojama taikant šį agregavimo metodą , kitaip eilutė formuojama taikant duomenų srauto sumos per laiko intervalą metodą 15. Penktas žingsnis - agreguotos laiko eilutės saugojimas 16 (dažniausiai laikinoje arba operatyvioje atmintyje) kol bus suformuota agreguota laiko eilutė pagal vartotojo nurodytą laiko eilutės ilgį.An algorithm that evaluates the eigenvalue of computer network traffic according to the presented method is shown in FIG. 2. First Step - Saving User Options 10 - Entering information about the selected aggregation interval, the aggregation method, the time series length being formed, the methods of estimating self-sufficiency and storing the results. Step Two - Retrieve Network Packets from Network Device 11. Step Three - Retrieve Information from Packet Headers 12. Step Four - Time Line Aggregation 13. If moving averaging smoothing method 14 is selected, this row is formed using this aggregation method, otherwise the row is formed using data 15. The fifth step is storing the aggregated time series 16 (usually in temporary or operative memory) until an aggregated time series is formed according to the user-specified time series length.

Kiekviena sekanti eilutė bus formuojama rekurentiškai, t. y. naikinamas pirmasis suformuotos eilutės narys ir pridedamas naujas agreguotas narys.Each successive line will be formed recursively, i.e. y. deletes the first member of the formed string and adds a new aggregated member.

Šeštas žingsnis - stabilumo parametrų skaičiavimas: pasirinktas robastinis empirinių kvantilių regresijos metodas 17, stabilumo indekso skaičiavimas 17a, pasirinktas IR statistikos metodas 18,Step Six - Calculation of Stability Parameters: Robust Empirical Quantum Regression Method 17, Stability Index Calculation 17a, IR Statistical Method 18,

IR įverčio skaičiavimas 18a, pasirinktas R/S statistikos metodas 19,IR estimation 18a, R / S statistical method selected 19,

Hurst koeficiento skaičiavimas 19a.Calculation of the Hurst Factor 19a.

Jei pasirinkti visi trys metodai, tai skaičiuojami visi parametrai.If all three methods are selected, all parameters are calculated.

Septintas žingsnis - rezultatų pateikimas vartotojui 20. Aštuntas žingsnis - rezultatų saugojimasStep Seven - Delivering Results to the User 20. Step Eight - Storing Results

21. Jei buvo pasirinkta saugoti rezultatus, tai gauti įverčiai yra saugomi pastoviojoje atmintyje 21a.21. If the results have been selected to be stored, the resulting estimates are stored in read-only memory 21a.

Siūlomas būdas yra patikrintas panaudojant kompiuterinio imitavimo metodą bei atliekant skaičiavimus su realaus tinklo duomenų paketais. Atsitiktiniams srautams imituoti buvo sukurtas modulis, generuojantis laiko eilutes, aprašomas α-stabiliais dydžiais S„(P, 1, 0), kai a f- 1. Generuotos savastingosios eilutės su šiais parametrais: a = 1,8 (H = 0,56), β = 0, σ = 1, μ = 0, generuojamų eilučių skaičius - 1000, o kiekvienos eilutės narių kiekis n =3000. Gauti skaičiavimo rezultatai atitiko generuojant parinktas reikšmes, t. y. 1,73 < a < 1,86, o 0,538 < H < 0,578.The proposed method has been tested using computer simulation method and calculations with real network data packets. To simulate random flows, a module was created that generates time series, described by α-stable values S „(P, 1, 0), when a f - 1. Characteristic rows were generated with the following parameters: a = 1.8 (H = 0.56) ), β = 0, σ = 1, μ = 0, the number of generated rows is 1000, and the number of members of each row is n = 3000. The results of the calculation were consistent with the selected values, i.e. y. 1.73 <a <1.86, and 0.538 <H <0.578.

Siūlomo būdo realizavimui sukurta savastingumo vertinimo programinių modulių biblioteka ( angį. Self-Similarity Estimator), sutrumpintai SSE. Naudojant siūlomą būdą buvo atlikti Šiaulių universiteto Nuotolinių studijų centro tinklo mazgo apkrovos matavimai realiu laiku. Apskaičiuotos 309 agreguotų laiko eilučių a stabilumo indekso ir Hurst koeficiento reikšmės. IR įverčio skaičiavimas parodė, kad 87,24% laiko eilučių pasižymi ilgalaike atmintimi (1 < a < 2). Vadinasi, agreguotomis eilutėmis aprašomas kompiuterių tinklu perduodamų duomenų paketų srautas yra persistentinis su ilgalaike atmintimi procesas. Keičiant agregavimo intervalą skaičiavimo rezultatai yra panašūs, vadinasi, laiko eilutės turi fraktalų savybių.In order to implement the proposed method, a library of self-similarity estimators (SSEs) has been created. The proposed method was used for real-time measurements of the network unit of Šiauliai University Distance Learning Center. The values of the 309 aggregate time series a stability index and Hurst coefficient were calculated. Calculation of the IR estimate showed that 87.24% of the time series exhibit long-term memory (1 <a <2). Consequently, the packet data traffic over aggregated lines is a continuous, long-term memory process. By changing the aggregation interval, the results of the calculation are similar, meaning that time series have fractal properties.

Įvertinus programa SSE gautų rezultatų standartinį nuokrypį, nustatyta, kad a stabilumo 5 indekso, IR įverčio ir Hurst koeficiento vertinimo metodai tinkami savastingumo parametrų nustatymui realiu laiku.The standard deviation of the results obtained by the SSE program showed that the methods for estimating the stability index 5, the IR estimate and the Hurst coefficient are suitable for real-time determination of the self-stability parameters.

Programinių modulių biblioteką taip pat galima naudoti apkrovos savastingumui matuoti tinklo mazge bei kliento kompiuteryje.The library of software modules can also be used to measure load specificity on a network node and on a client computer.

Pagal matavimo rezultatus ir taikomą tinklo modelį galima prognozuoti srauto pliūpsnius 10 tinklo mazguose ir imtis prevencinių priemonių jiems sumažinti.Measurement results and the applied network model allow forecasting traffic surges at 10 network nodes and taking preventive measures to reduce them.

IŠRADIMO APIBRĖŽTISDEFINITION OF INVENTION

Claims (3)

IŠRADIMO APIBRĖŽTISDEFINITION OF INVENTION 1. Kompiuterių tinklo srauto analizės realiu laiku būdas, kai rekurentiškai formuoja eilutę, skaičiuoja statistinius jos parametrus ir rezultatus saugo laikinojoje atmintyje, besiskiriantis tuo, kad:1. A real-time computer network traffic analysis method, which recursively forms a string, computes its statistical parameters, and stores the results in a cache memory that: 5 realiu laiku agreguoja tinklo srautą taikant judančių vidurkių glotninimo metodą arba perduotų duomenų srauto sumos per laiko intervalą metodą; suformuotą eilutę saugo laikinoje atmintyje;5 aggregate network traffic in real time using the smoothing method of moving averages or the sum of transmitted traffic over time; caches the formed string in cache memory; rekurentiškai skaičiuoja dinamiškai formuojamos eilutės savastingumo parametrus; skaičiavimo rezultatus tolesnei analizei saugo laikinojoje arba/ir pastoviojojerecursively calculates the self-parameters of a dynamically formed string; the results of the calculation shall be stored in a temporary or / and permanent form for further analysis 10 atmintyje;10 in memory; 2. Būdas pagal 1 punktą, besiskiriantis tuo, kad savastingumo parametrus skaičiuoja taikant robastinį empirinių kvantilių regresijos metodą, IR statistiką ir R/S statistiką.2. The method of claim 1, wherein the eigenvalue parameters are calculated using a robust empirical quantile regression method, IR statistics and R / S statistics. 3. Būdas pagal 2 punktą, besiskiriantis tuo, kad savastingumo įvertinimui3. A method according to claim 2, characterized in that the self-evaluation 15 skaičiuoja a stabilumo indeksą, IR įvertį ir Hurst koeficientą.15 calculates the a stability index, IR estimate, and Hurst coefficient.
LT2011099A 2011-12-05 2011-12-05 Analysis method of computer network traffic in real time LT5869B (en)

Priority Applications (1)

Application Number Priority Date Filing Date Title
LT2011099A LT5869B (en) 2011-12-05 2011-12-05 Analysis method of computer network traffic in real time

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
LT2011099A LT5869B (en) 2011-12-05 2011-12-05 Analysis method of computer network traffic in real time

Publications (2)

Publication Number Publication Date
LT2011099A LT2011099A (en) 2012-06-25
LT5869B true LT5869B (en) 2012-09-25

Family

ID=46261548

Family Applications (1)

Application Number Title Priority Date Filing Date
LT2011099A LT5869B (en) 2011-12-05 2011-12-05 Analysis method of computer network traffic in real time

Country Status (1)

Country Link
LT (1) LT5869B (en)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5343465A (en) 1993-06-11 1994-08-30 Bell Communications Research, Inc. Method and system for real-time burstiness analysis of network traffic
WO1999040703A1 (en) 1998-02-06 1999-08-12 Ericsson Australia Pty. Ltd. Real-time estimation of long range dependent parameters
EP1780955A1 (en) 2005-10-28 2007-05-02 Siemens Aktiengesellschaft Monitoring method and apparatus of processing of a data stream with high rate/flow
EP1983687A1 (en) 2007-04-20 2008-10-22 Nokia Siemens Networks Oy Methods for estimating self-similarity degree and related estimator

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5343465A (en) 1993-06-11 1994-08-30 Bell Communications Research, Inc. Method and system for real-time burstiness analysis of network traffic
WO1999040703A1 (en) 1998-02-06 1999-08-12 Ericsson Australia Pty. Ltd. Real-time estimation of long range dependent parameters
EP1780955A1 (en) 2005-10-28 2007-05-02 Siemens Aktiengesellschaft Monitoring method and apparatus of processing of a data stream with high rate/flow
EP1983687A1 (en) 2007-04-20 2008-10-22 Nokia Siemens Networks Oy Methods for estimating self-similarity degree and related estimator

Also Published As

Publication number Publication date
LT2011099A (en) 2012-06-25

Similar Documents

Publication Publication Date Title
EP1952579B1 (en) Using filtering and active probing to evaluate a data transfer path
US8588074B2 (en) Data transfer path evaluation using filtering and change detection
US7509229B1 (en) Bayesian approach to correlating network traffic congestion to performance metrics
Nguyen et al. Rigorous statistical analysis of internet loss measurements
Lübben et al. A foundation for stochastic bandwidth estimation of networks with random service
Hága et al. Understanding Packet Pair Separation Beyond the Fluid Model: The Key Role of Traffic Granularity.
LT5869B (en) Analysis method of computer network traffic in real time
Ouyang et al. Predictive bandwidth control for mpeg video: A wavelet approach for self-similar parameters estimation
Ekelin et al. Continuous monitoring of available bandwidth over a network path
Cheng et al. Internet traffic characterization using packet-pair probing
Cheng et al. New exploration of packet-pair probing for available bandwidth estimation and traffic characterization
Jin et al. Predicting properties of congestion events for a queueing system with fBm traffic
Vuletić et al. Self-similar cross-traffic analysis as a foundation for choosing among active available bandwidth measurement strategies
Pacheco et al. Local and cumulative analysis of self-similar traffic traces
Aspirot et al. End-to-end quality of service prediction based on functional regression
Fernandes et al. Accurate and fast replication on the generation of fractal network traffic using alternative probablity models
Vakili et al. Estimation of packet loss probability from traffic parameters for multimedia over IP
Giorgi et al. Rate-interval curves—A tool for the analysis and monitoring of network traffic
Kapoor et al. CapProbe: A simple and accurate capacity estimation technique for wired and wireless environments
Dymora et al. VoIP Anomaly Detection-selected methods of statistical analysis
She et al. Estimation of statistical bandwidth through backlog measurement
Yang et al. An accurate approach for traffic matrix estimation in large-scale backbone networks
CA2527740C (en) Using filtering and active probing to evaluate a data transfer path
Hosseinpour et al. Packet-pair behavior in wired and 802.11-type wireless connection and the use of data clustering algorithms for dispersion-mode tracking
Lin et al. A Novel Real-Time Self-similar Traffic Detector/Filter to Improve the Reliability of a TCP Based End-to-End Client/Server Interaction Path for Shorter Roundtrip Time

Legal Events

Date Code Title Description
MM9A Lapsed patents

Effective date: 20131205