CN113705726A - 流量的分类方法、装置、电子设备及计算机可读介质 - Google Patents
流量的分类方法、装置、电子设备及计算机可读介质 Download PDFInfo
- Publication number
- CN113705726A CN113705726A CN202111080244.1A CN202111080244A CN113705726A CN 113705726 A CN113705726 A CN 113705726A CN 202111080244 A CN202111080244 A CN 202111080244A CN 113705726 A CN113705726 A CN 113705726A
- Authority
- CN
- China
- Prior art keywords
- flow
- sequence
- traffic
- segment
- time sequence
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 59
- 230000011218 segmentation Effects 0.000 claims abstract description 97
- 230000002159 abnormal effect Effects 0.000 claims description 27
- 238000012549 training Methods 0.000 claims description 17
- 238000004590 computer program Methods 0.000 claims description 10
- 238000005452 bending Methods 0.000 claims description 7
- 230000015654 memory Effects 0.000 claims description 7
- 238000013145 classification model Methods 0.000 claims 1
- 239000012634 fragment Substances 0.000 abstract description 6
- 238000010586 diagram Methods 0.000 description 19
- 230000006870 function Effects 0.000 description 7
- 238000012423 maintenance Methods 0.000 description 7
- 230000005856 abnormality Effects 0.000 description 5
- 230000001960 triggered effect Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004422 calculation algorithm Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 4
- 238000004891 communication Methods 0.000 description 4
- 238000001514 detection method Methods 0.000 description 4
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 230000003287 optical effect Effects 0.000 description 4
- 238000012545 processing Methods 0.000 description 4
- 230000006399 behavior Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000000354 decomposition reaction Methods 0.000 description 3
- 238000012544 monitoring process Methods 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009471 action Effects 0.000 description 2
- 230000003044 adaptive effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 2
- 238000005206 flow analysis Methods 0.000 description 2
- 230000006872 improvement Effects 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 239000011159 matrix material Substances 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000000644 propagated effect Effects 0.000 description 2
- 230000009467 reduction Effects 0.000 description 2
- 230000008439 repair process Effects 0.000 description 2
- 239000004065 semiconductor Substances 0.000 description 2
- 230000006978 adaptation Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 230000001186 cumulative effect Effects 0.000 description 1
- 238000013135 deep learning Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 239000000835 fiber Substances 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000003909 pattern recognition Methods 0.000 description 1
- 230000003252 repetitive effect Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 230000006403 short-term memory Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/22—Matching criteria, e.g. proximity measures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Computation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Computational Linguistics (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Molecular Biology (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Software Systems (AREA)
- Data Exchanges In Wide-Area Networks (AREA)
Abstract
本公开涉及一种流量的分类方法、装置、电子设备及计算机可读介质,属于互联网技术领域。该方法包括:获取从客户端采集的流量序列,并根据预先训练的流量分割模型对所述流量序列进行分割,得到所述流量序列对应的流量时序片段;确定所述流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离;根据所述流量时序片段与所述历史流量时序片段之间的序列相似度距离,确定所述流量时序片段的流量类型。本公开通过流量分割模型对流量序列进行合理分割得到流量时序片段,并通过相似度匹配的方式确定流量时序片段的流量类型,可以提高流量溯源的准确度和效率。
Description
技术领域
本公开涉及互联网技术领域,具体而言,涉及一种流量的分类方法、流量的分类装置、电子设备及计算机可读介质。
背景技术
随着互联网行业的高速发展,用户在网络上的行为已经做到了可监督、可记录、可回溯。在客服、广告、物流等业务场景下,对于用户流量的分析成为了企业实现降本增效的关键。
一般的,流量分析包含三个主要部分:流量预测、流量分类、流量分解。其中,流量分类是指对流量时序序列进行模式分类和识别。然而目前的流量分类方法普遍存在着流量段分割不准、溯源困难、溯源准确度较低等问题。
鉴于此,本领域亟需一种能够提高流量溯源的准确度和效率的流量的分类方法。
需要说明的是,在上述背景技术部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本公开的目的在于提供一种流量的分类方法、流量的分类装置、电子设备及计算机可读介质,进而至少在一定程度上提高流量溯源的准确度和效率。
根据本公开的第一个方面,提供一种流量的分类方法,包括:
获取从客户端采集的流量序列,并根据预先训练的流量分割模型对所述流量序列进行分割,得到所述流量序列对应的流量时序片段;
确定所述流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离;
根据所述流量时序片段与所述历史流量时序片段之间的序列相似度距离,确定所述流量时序片段的流量类型。
在本公开的一种示例性实施例中,所述流量分割模型为二分类模型,所述根据预先训练的流量分割模型对所述流量序列进行分割,得到所述流量序列对应的流量时序片段,包括:
将所述流量序列中的各个序列点按照时间倒序依次输入预先训练的流量分割模型中,确定各个所述序列点对应的输出类型;
若所述序列点在所述流量分割模型的输出类型为不分割序列点,则继续进行下一序列点的分类;
若所述序列点在所述流量分割模型的输出类型为分割序列点,则在所述分割序列点对所述流量序列进行分割,得到所述流量序列对应的流量时序片段。
在本公开的一种示例性实施例中,所述流量分割模型的训练方法包括:
将所述历史流量模板库中的所述历史流量时序片段作为所述流量分割模型的训练样本,并获取所述历史流量时序片段的时序特征;
根据所述历史流量时序片段的时序特征,以及所述历史流量时序片段中各个序列点的分割类型,训练所述流量分割模型。
在本公开的一种示例性实施例中,所述确定所述流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离,包括:
根据所述流量时序片段中各个序列点的值,以及所述历史流量模板库中的历史流量时序片段中各个序列点的值,得到所述流量时序片段与所述历史流量时序片段之间的动态时间弯曲距离;
将所述流量时序片段与所述历史流量时序片段之间的动态时间弯曲距离作为所述序列相似度距离。
在本公开的一种示例性实施例中,所述根据所述流量时序片段与所述历史流量时序片段之间的序列相似度距离,确定所述流量时序片段的流量类型,包括:
判断所述流量时序片段与所述历史流量时序片段之间的序列相似度距离是否小于或等于相似度距离阈值;
若所述序列相似度距离小于或等于所述相似度距离阈值,则对所述流量时序片段以及所述历史流量时序片段进行聚类,并根据聚类后的所述历史流量时序片段对应的历史流量类型确定所述流量时序片段的流量类型;
若所述序列相似度距离大于所述相似度距离阈值,则将所述流量时序片段的流量类型确定为新增流量类型。
在本公开的一种示例性实施例中,所述判断所述流量时序片段与所述历史流量时序片段之间的序列相似度距离是否小于或等于相似度距离阈值,包括:
获取所述流量时序片段与所述历史流量时序片段之间的动态时间弯曲距离的拐点个数;
若所述拐点个数小于或等于拐点阈值,则判定所述流量时序片段与所述历史流量时序片段之间的序列相似度距离小于或等于相似度距离阈值。
在本公开的一种示例性实施例中,所述方法还包括:
若所述流量时序片段的流量类型为所述历史流量类型,则根据所述流量时序片段更新所述历史流量类型对应的历史流量时序片段的中心曲线;
若所述流量时序片段的流量类型为所述新增流量类型,则根据所述流量时序片段在所述历史流量模板库中生成所述新增流量类型对应的中心曲线。
在本公开的一种示例性实施例中,所述方法还包括:
若所述流量时序片段的流量类型为所述历史流量类型中的异常流量类型,则根据所述异常流量类型触发对应的异常预警信息。
根据本公开的第二方面,提供一种流量的分类装置,包括:
流量序列分割模块,用于获取从客户端采集的流量序列,并根据预先训练的流量分割模型对所述流量序列进行分割,得到所述流量序列对应的流量时序片段;
相似距离确定模块,用于确定所述流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离;
流量类型确定模块,用于根据所述流量时序片段与所述历史流量时序片段之间的序列相似度距离,确定所述流量时序片段的流量类型。
根据本公开的第三方面,提供一种电子设备,包括:处理器;以及存储器,用于存储所述处理器的可执行指令;其中,所述处理器配置为经由执行所述可执行指令来执行上述任意一项所述的流量的分类方法。
根据本公开的第四方面,提供一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述任意一项所述的流量的分类方法。
本公开示例性实施例可以具有以下有益效果:
本公开示例实施方式的流量的分类方法中,通过流量分割模型对连续的流量序列进行合理分割得到对应的流量时序片段,并通过与历史流量模板库中的历史流量时序片段进行相似度匹配的方式,找出当前流量时序片段是否为已经出现过的流量趋势形状,从而确定出流量时序片段的流量类型。本公开示例实施方式中的流量的分类方法,一方面,可以通过流量分割模型解决流量序列的自适应分割问题,提高流量段分割的准确性,进一步地提高流量溯源的准确度;另一方面,可以实现流量时序片段的快速溯源和未知异常趋势的发现,提高了流量溯源的效率,并且能实现历史流量模板库的自动更新,能够有效应用于系统运维、业务监控等场景中。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1示出了本公开示例实施方式的流量的分类方法的流程示意图;
图2示出了本公开示例实施方式的根据流量分割模型对流量序列进行分割的流程示意图;
图3示意性示出了根据本公开的一个具体实施方式的流量序列分割的示意图;
图4示出了本公开示例实施方式的流量分割模型的训练方法的流程示意图;
图5示意性示出了根据本公开的一个具体实施方式的动态时间弯曲距离的示意图;
图6示出了本公开示例实施方式的根据序列相似度距离确定流量时序片段的流量类型的流程示意图;
图7示意性示出了根据本公开的一个具体实施方式的流量时序片段的中心线段值的示意图;
图8示意性示出了根据本公开的一个具体实施方式中流量趋势序列自动溯源系统的示意图;
图9示意性示出了根据本公开的一个具体实施方式中流量趋势序列自动溯源模型的示意图;
图10示出了本公开示例实施方式的流量的分类装置的框图;
图11示出了适于用来实现本公开实施方式的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本公开将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施方式中。在下面的描述中,提供许多具体细节从而给出对本公开的实施方式的充分理解。然而,本领域技术人员将意识到,可以实践本公开的技术方案而省略所述特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知技术方案以避免喧宾夺主而使得本公开的各方面变得模糊。
此外,附图仅为本公开的示意性图解,并非一定是按比例绘制。图中相同的附图标记表示相同或类似的部分,因而将省略对它们的重复描述。附图中所示的一些方框图是功能实体,不一定必须与物理或逻辑上独立的实体相对应。可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
目前,随着互联网行业的高速发展,用户在网络上的行为已经做到了可监督、可记录、可回溯。通过一次次的点击、浏览行为,用户流转变成了信息流。而对于企业而言,如何最小成本地应对信息流,成为了降本增效的关键。这就催生了时序流量分析在行业内的发展,包括在客服、广告、物流等多个业务场景下,流量分析已经展开应用。
一般的,流量分析包含了三个主要部分:流量预测、流量分类、流量分解。其中,流量预测,是指通过时序算法、机器学习类算法、神经网络类算法等模型,基于已经发生的历史数据和外部特征,对未来一段时间的流量进行预测,典型的算法有Holt-Winters(霍尔特-温特方法)、GBM(Generalized Boosted Regression Models,通用梯度回归模型)、XGBoost(eXtreme Gradient Boosting,极致梯度提升)、LSTM(Long short-term memory,长短期记忆)等模型;流量分类,是指对流量时序序列进行模式分类和识别,通常可以采用有监督分类与无监督聚类的方式进行;流量分解,是指将一段时序数据拆分为多个和原序列等长时序的数据,同时新时序序列可以通过加权和或者加权乘的方式,组合成为原序列信号。
目前,流量分类已经被用于系统运维、流量监控、归因分析等多种业务场景,但是流量分类方法普遍面临溯源困难、异常检测困难、流量段分割不准等问题。
在一些相关的实施例中,可以通过以下几种方法对流量进行趋势监测:
第一种是异常点检测,主要针对的是流量在时间序列上产生了大幅突变的异常情况,通常表现为幅度的跳跃或者异常的斜率,这种检测方法通常依赖经验性的阈值设置较多,且对于缓慢变化的异常情况,无法使用。
第二种是同环比检测,对照同周期数据,进行同环比检测,这种数据监测方式能够对缓慢变化的流量异常进行监测,但是同样依赖于人工定义的阈值,此外,周期的选择是固定的,不适用于存在非周期性噪声的序列。
第三种是针对现有流量段落使用机器学习或者深度学习的方法预测趋势走向,从而判定出流量是否会在未来保持在正确的范围内。这种方法会更加灵活,能够在缓慢异常发生前就判定出来。只是这种方式只能用于判断异常会发生,而异常产生的原因、性质都无从找寻,不利于快速评估和处理异常。
第四种是对现有流量段和历史的流量段做相似度对比,这里有几个问题,第一,是如何比较两个流量的相似性,从点到点数值上的平均误差很难说明相似性。第二,一段长流量与一段短流量有可能是同一种形态及同一性质的流量,只是因为影响度不同,导致形状被拉长,因此流量段不一定是等长的。第三,如何切分现有的流量段才合适,由于一段流量序列是连续的信号,需要在合适的点做切割,才能保障与历史的流量段匹配时,不会因为太长或者太短影响了相似度。第四,当一种新类型的流量被发现时,通常不能自动被判定为新的流量形态,需要人工更新模版库。
因此,为了解决上述问题,需要一种能够灵活分割流量时间序列,同时能够对比历史流量特点,自动发现当前流量形状特性,且能够溯源出当前变化产生的原因及未来发展趋势,方便业务快速定位与响应的流量趋势自动溯源的方法。
本示例实施方式首先提供了一种流量的分类方法。参考图1所示,上述流量的分类方法可以包括以下步骤:
步骤S110.获取从客户端采集的流量序列,并根据预先训练的流量分割模型对流量序列进行分割,得到流量序列对应的流量时序片段。
步骤S120.确定流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离。
步骤S130.根据流量时序片段与历史流量时序片段之间的序列相似度距离,确定流量时序片段的流量类型。
本公开示例实施方式的流量的分类方法中,通过流量分割模型对连续的流量序列进行合理分割得到对应的流量时序片段,并通过与历史流量模板库中的历史流量时序片段进行相似度匹配的方式,找出当前流量时序片段是否为已经出现过的流量趋势形状,从而确定出流量时序片段的流量类型。本公开示例实施方式中的流量的分类方法,一方面,可以通过流量分割模型解决流量序列的自适应分割问题,提高流量段分割的准确性,进一步地提高流量溯源的准确度;另一方面,可以实现流量时序片段的快速溯源和未知异常趋势的发现,提高了流量溯源的效率,并且能实现历史流量模板库的自动更新,能够有效应用于系统运维、业务监控等场景中。
下面,结合图2至图6对本示例实施方式的上述步骤进行更加详细的说明。
在步骤S110中,获取从客户端采集的流量序列,并根据预先训练的流量分割模型对流量序列进行分割,得到流量序列对应的流量时序片段。
本示例实施方式中,流量序列是通过对各个客户端采集到的流量进行定期的累积求和,并打上时间段标签,从而得到的连续的流量时间序列数据,可以包括登陆量、点击量、曝光量等类型的流量数据。从客户端获取流量序列时,需要保证获取到的流量序列的类型相同,比如只获取登陆量对应的流量序列,或者只获取点击量对应的流量序列。
由于获取到的流量序列为连续不定长序列,因此,首先需要对连续流量序列进行合理分割。本示例实施方式中,如图2所示,可以使用预先训练的流量分割模型对流量序列进行分割,得到流量序列对应的流量时序片段,具体可以包括以下几个步骤:
步骤S210.将流量序列中的各个序列点按照时间倒序依次输入预先训练的流量分割模型中,确定各个序列点对应的输出类型。
本示例实施方式中,将流量序列输入预先训练的流量分割模型中时,可以先将流量序列中的各个序列点按照时间点倒序的方式,从当前的序列点开始依次添加之前的各个序列点到临时队列中,然后依次输入到流量分割模型里,通过流量分割模型确定各个序列点对应的输出类型。其中,序列点的输出类型包括分割序列点和不分割序列点。
步骤S220.若序列点在流量分割模型的输出类型为不分割序列点,则继续进行下一序列点的分类。
若当前序列点在流量分割模型的输出类型为不分割序列点,表示在该序列点处不进行分割,则继续通过流量分割模型进行下一序列点输出类型的判断。
步骤S230.若序列点在流量分割模型的输出类型为分割序列点,则在分割序列点对流量序列进行分割,得到流量序列对应的流量时序片段。
若当前序列点在流量分割模型的输出类型为分割序列点,则表示需要在该序列点处进行分割,此时,结合上一分割序列点即可获得分割后的流量时序片段。
图3示意性示出了根据本公开的一个具体实施方式的流量序列分割的示意图,其中,该流量时序片段的起始点与终止点即为通过流量分割模型判断得到的分割序列点,在这两点对流量序列进行分割后,即得到如图3所示的流量时序片段。
本示例实施方式中,如图4所示,上述流量分割模型的训练方法具体可以包括以下几个步骤:
步骤S410.将历史流量模板库中的历史流量时序片段作为流量分割模型的训练样本,并获取历史流量时序片段的时序特征。
本示例实施方式中,可以将历史流量模板库中的历史流量时序片段作为流量分割模型的训练样本,样本特征来自于历史流量时序片段的时序特征,包含序列长度、全局极值点的值及序号、局部极值点数量、序列均值、序列方差、起始点到终点的差值、序列斜率均值等。
步骤S420.根据历史流量时序片段的时序特征,以及历史流量时序片段中各个序列点的分割类型,训练流量分割模型。
本示例实施方式中的流量分割模型可以选择二分类的有监督神经网络,流量分割模型的输出结果为分割或者不分割两种类型。
在步骤S120中,确定流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离。
获得切割后的流量时序片段之后,由于流量时序片段的长度与历史流量模板库中的每个历史流量时序片段并不相同,因此,不能直接使用欧式距离作为相似性判断标准。
本示例实施方式中,可以使用DTW(Dynamic time warping,动态时间弯曲)距离作为流量时序片段与历史流量时序片段之间的序列相似度距离,具体的,可以根据流量时序片段中各个序列点的值,以及历史流量模板库中的历史流量时序片段中各个序列点的值,得到流量时序片段与历史流量时序片段之间的动态时间弯曲距离,然后将流量时序片段与历史流量时序片段之间的动态时间弯曲距离作为序列相似度距离。DTW距离的具体计算方法如下:
假设相比较的两个序列为序列a和序列b,则两个序列之间的DTW距离的计算公式为:
其中,序列a和序列b分别包括多个序列点,i表示序列a中的各个序列点的序号,j表示序列b中的各个序列点的序号,a[i]表示序列a中的第i个序列点的值,b[j]表示序列b中的第j个序列点的值。DTW距离的图像化表达如图5所示,距离矩阵中的每个值dp[i][j]表示序列a中的第i个序列点与序列b中的第j个序列点的DTW距离,颜色越深的值表示DTW距离越小。
在步骤S130中,根据流量时序片段与历史流量时序片段之间的序列相似度距离,确定流量时序片段的流量类型。
本示例实施方式中,根据流量时序片段与历史流量时序片段之间的序列相似度距离,如DTW距离,可以找出当前流量时序片段与历史流量时序片段之间的差异。
本示例实施方式中,如图6所示,根据流量时序片段与历史流量时序片段之间的序列相似度距离,确定流量时序片段的流量类型,具体可以包括以下几个步骤:
步骤S610.判断流量时序片段与历史流量时序片段之间的序列相似度距离是否小于或等于相似度距离阈值。
本示例实施方式中,可以通过动态时间弯曲距离的拐点个数来判断序列相似度距离是否小于或等于相似度距离阈值,具体的,可以获取流量时序片段与历史流量时序片段之间的动态时间弯曲距离的拐点个数,若拐点个数小于或等于拐点阈值,则判定流量时序片段与历史流量时序片段之间的序列相似度距离小于或等于相似度距离阈值。
如图5所示,由于DTW距离的解空间是一个以两条序列长度为长宽的距离矩阵,DTW距离计算路径为不断在解空间中以最短路径前行,直到从左上角到达右下角,在此过程中,路径的拐点数能够表征局部相似性变化次数,如果拐点个数超过拐点阈值,相当于局部相似性变化超过阈值,即可认定为是一条新的流量序列。
步骤S620.若序列相似度距离小于或等于相似度距离阈值,则对流量时序片段以及历史流量时序片段进行聚类,并根据聚类后的历史流量时序片段对应的历史流量类型确定流量时序片段的流量类型。
以DTW距离为依据,其主要目的是为了找出当前流量时序片段与模版库中的历史流量时序片段的差异是否符合门限,如果符合门限,则说明当前流量时序片段属于历史流量时序片段中的一种,此时会触发自动聚类,对当前流量时序片段和历史模版库中的历史流量时序片段进行聚类,聚类方法可例如KMedoids聚类等,以最近的历史流量时序片段对应的历史流量类型为其分类。对流量时序片段进行聚类的方法不需要提前对流量打上类型标签,是根据流量本身的特征直接分成多个聚类,得到对应的流量类型。
本示例实施方式中,若流量时序片段的流量类型为历史流量类型,则根据流量时序片段更新历史流量类型对应的历史流量时序片段的中心曲线。如图7所示,中心线段值指的是一个分类里面所有线段中最具有代表性的一条线段,确定中心线段值的方法可以使用KMedoids聚类方法中自带的方法,通过更新对应的中心线段值可以使其更具备鲁棒性。
步骤S630.若序列相似度距离大于相似度距离阈值,则将流量时序片段的流量类型确定为新增流量类型。
若序列相似度距离大于相似度距离阈值,则说明当前流量时序片段不属于历史流量时序片段中的任意一种,因此,将其确定为新增流量类型。
本示例实施方式中,若流量时序片段的流量类型为新增流量类型,则根据流量时序片段在历史流量模板库中生成新增流量类型对应的中心曲线。当下次再有同类趋势发生时,即可实现模式匹配和预警。
本示例实施方式中,若流量时序片段的流量类型为历史流量类型中的异常流量类型,则根据异常流量类型触发对应的异常预警信息。
历史流量类型中包含有一部分异常流量类型,当流量时序片段匹配为异常流量类型时,会触发异常报错,运维人员即可根据异常流量类型对应的标签来定位错误位置,快速修复异常。若当前流量时序片段为此前未发生过的新的异常流量类型时,可以由相关运维人员为其打上新的异常流量类型标签,以便下次快速溯源。
如图8所示是根据本公开的一个具体实施方式中流量趋势序列自动溯源系统的示意图,是本示例实施方式中上述步骤的一种具体应用场景。该流量趋势序列自动溯源系统的具体架构和功能如下:
流量从各个客户端传输至流量采集系统801,这里的流量可以是登陆量、点击量、曝光量等各种统计数量,但是需要保持各个端的统计口径一致,即每个端口获取的流量类型一致,比如A端口获取的是登陆量,则其他端口也获取登陆量。
流量采集系统801通过对流量进行定期的累积求和,并打上时间段标签,获得连续的流量时间序列数据,此时的流量序列为连续不定长序列。
流量趋势自动溯源模型802可以实现流量的分割、模式识别、聚类,此处的识别与聚类是通过将流量时序片段与历史流量模板库中的历史流量时序片段对比实现的。
经过流量趋势自动溯源模型802后,获得结果有两种,一种是当前流量时序片段的趋势符合历史流量模版库的一个,此时会触发自动聚类,更新该历史流量时序片段的中心曲线,使其更具备鲁棒性;另一种是该流量时序片段的趋势是一种新的流量特性,此时会在历史模版库中生成新的模版中心曲线,当下次同类趋势发生时,即可实现模式预警。
当流量时序片段匹配为异常类型时,会通过异常提醒及标注系统803触发异常报错,运维人员即可根据异常模版的标签来定位错误位置,快速修复异常。若当前流量段为此前未发生过的新流量模式时,可以由相关运维人员为新趋势模版打上异常原因标签,以便下次快速溯源。
如图9所示是根据本公开的一个具体实施方式中流量趋势序列自动溯源模型的示意图,是对图8中的流量趋势自动溯源模型802的详细说明。该流量趋势序列自动溯源模型目的是为了对当前的流量趋势形状进行分类,监测是否为异常情况。从模型内部而言,有三层结构,分别是序列分割、模式匹配、自动聚类。该模型的具体原理如下:
对于获取到的流量时间序列901,首先使用预先训练的流量分割模型902进行分割。当流量时间序列901进入该流量分割模型902时,从当前点开始倒序依次添加过去的点到临时队列中,并输入到流量分割模型902里,直到流量分割模型902的输出结果为分割,则获得当前的特征流量段903。
获得切割后的特征流量段903后,以DTW距离为依据,其主要目的是为了找出当前片段与历史模版库中流量模板904的差异,判断是否符合门限,如果符合门限,则对当前特征流量段903和历史模版库的片段进行KMedoids聚类,以最近的历史片段为其分类,并更新该片段的中心线段值。若不符合门限,则将当前特征流量段903确定为新增的流量类型,并生成新的中心线段值保存在历史模版库中。
应当注意,尽管在附图中以特定顺序描述了本公开中方法的各个步骤,但是,这并非要求或者暗示必须按照该特定顺序来执行这些步骤,或是必须执行全部所示的步骤才能实现期望的结果。附加的或备选的,可以省略某些步骤,将多个步骤合并为一个步骤执行,以及/或者将一个步骤分解为多个步骤执行等。
进一步的,本公开还提供了一种流量的分类装置。参考图10所示,该流量的分类装置可以包括流量序列分割模块1010、相似距离确定模块1020以及流量类型确定模块1030。其中:
流量序列分割模块1010可以用于获取从客户端采集的流量序列,并根据预先训练的流量分割模型对流量序列进行分割,得到流量序列对应的流量时序片段;
相似距离确定模块1020可以用于确定流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离;
流量类型确定模块1030可以用于根据流量时序片段与历史流量时序片段之间的序列相似度距离,确定流量时序片段的流量类型。
在本公开的一些示例性实施例中,流量序列分割模块1010可以包括分割模型输入单元、下一序列点分类单元以及当前序列点分割单元。其中:
分割模型输入单元可以用于将流量序列中的各个序列点按照时间倒序依次输入预先训练的流量分割模型中,确定各个序列点对应的输出类型;
下一序列点分类单元可以用于若序列点在流量分割模型的输出类型为不分割序列点,则继续进行下一序列点的分类;
当前序列点分割单元可以用于若序列点在流量分割模型的输出类型为分割序列点,则在分割序列点对流量序列进行分割,得到流量序列对应的流量时序片段。
在本公开的一些示例性实施例中,本公开提供的一种流量的分类装置还可以包括分割模型训练模块,该分割模型训练模块可以包括时序特征获取单元以及分割模型训练单元。其中:
时序特征获取单元可以用于将历史流量模板库中的历史流量时序片段作为流量分割模型的训练样本,并获取历史流量时序片段的时序特征;
分割模型训练单元可以用于根据历史流量时序片段的时序特征,以及历史流量时序片段中各个序列点的分割类型,训练流量分割模型。
在本公开的一些示例性实施例中,相似距离确定模块1020可以包括动态时间弯曲距离确定单元以及序列相似度距离确定单元。其中:
动态时间弯曲距离确定单元可以用于根据流量时序片段中各个序列点的值,以及历史流量模板库中的历史流量时序片段中各个序列点的值,得到流量时序片段与历史流量时序片段之间的动态时间弯曲距离;
序列相似度距离确定单元可以用于将流量时序片段与历史流量时序片段之间的动态时间弯曲距离作为序列相似度距离。
在本公开的一些示例性实施例中,流量类型确定模块1030可以包括序列相似度距离判断单元、历史流量类型确定单元以及新增流量类型确定单元。其中:
序列相似度距离判断单元可以用于判断流量时序片段与历史流量时序片段之间的序列相似度距离是否小于或等于相似度距离阈值;
历史流量类型确定单元可以用于若序列相似度距离小于或等于相似度距离阈值,则对流量时序片段以及历史流量时序片段进行聚类,并根据聚类后的历史流量时序片段对应的历史流量类型确定流量时序片段的流量类型;
新增流量类型确定单元可以用于若序列相似度距离大于相似度距离阈值,则将流量时序片段的流量类型确定为新增流量类型。
在本公开的一些示例性实施例中,序列相似度距离判断单元可以包括拐点个数获取单元以及拐点阈值判断单元。其中:
拐点个数获取单元可以用于获取流量时序片段与历史流量时序片段之间的动态时间弯曲距离的拐点个数;
拐点阈值判断单元可以用于若拐点个数小于或等于拐点阈值,则判定流量时序片段与历史流量时序片段之间的序列相似度距离小于或等于相似度距离阈值。
在本公开的一些示例性实施例中,流量类型确定模块1030还可以包括中心曲线更新单元以及中心曲线新增单元。其中:
中心曲线更新单元可以用于若流量时序片段的流量类型为历史流量类型,则根据流量时序片段更新历史流量类型对应的历史流量时序片段的中心曲线;
中心曲线新增单元可以用于若流量时序片段的流量类型为新增流量类型,则根据流量时序片段在历史流量模板库中生成新增流量类型对应的中心曲线。
在本公开的一些示例性实施例中,流量类型确定模块1030还可以包括异常类型预警单元,可以用于若流量时序片段的流量类型为历史流量类型中的异常流量类型,则根据异常流量类型触发对应的异常预警信息。
上述流量的分类装置中各模块/单元的具体细节在相应的方法实施例部分已有详细的说明,此处不再赘述。
图11示出了适于用来实现本发明实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图11示出的电子设备的计算机系统1100仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图11所示,计算机系统1100包括中央处理单元(CPU)1101,其可以根据存储在只读存储器(ROM)1102中的程序或者从存储部分1108加载到随机访问存储器(RAM)1103中的程序而执行各种适当的动作和处理。在RAM 1103中,还存储有系统操作所需的各种程序和数据。CPU1101、ROM 1102以及RAM 1103通过总线1104彼此相连。输入/输出(I/O)接口1105也连接至总线1104。
以下部件连接至I/O接口1105:包括键盘、鼠标等的输入部分1106;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分1107;包括硬盘等的存储部分1108;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分1109。通信部分1109经由诸如因特网的网络执行通信处理。驱动器1110也根据需要连接至I/O接口1105。可拆卸介质1111,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器1110上,以便于从其上读出的计算机程序根据需要被安装入存储部分1108。
特别地,根据本发明的实施例,下文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分1109从网络上被下载和安装,和/或从可拆卸介质1111被安装。在该计算机程序被中央处理单元(CPU)1101执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本公开所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现如下述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块,但是这种划分并非强制性的。实际上,根据本公开的实施方式,上文描述的两个或更多模块的特征和功能可以在一个模块中具体化。反之,上文描述的一个模块的特征和功能可以进一步划分为由多个模块来具体化。
本领域技术人员在考虑说明书及实践这里公开的发明后,将容易想到本公开的其它实施方案。本申请旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。
Claims (11)
1.一种流量的分类方法,其特征在于,包括:
获取从客户端采集的流量序列,并根据预先训练的流量分割模型对所述流量序列进行分割,得到所述流量序列对应的流量时序片段;
确定所述流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离;
根据所述流量时序片段与所述历史流量时序片段之间的序列相似度距离,确定所述流量时序片段的流量类型。
2.根据权利要求1所述的流量的分类方法,其特征在于,所述流量分割模型为二分类模型,所述根据预先训练的流量分割模型对所述流量序列进行分割,得到所述流量序列对应的流量时序片段,包括:
将所述流量序列中的各个序列点按照时间倒序依次输入预先训练的流量分割模型中,确定各个所述序列点对应的输出类型;
若所述序列点在所述流量分割模型的输出类型为不分割序列点,则继续进行下一序列点的分类;
若所述序列点在所述流量分割模型的输出类型为分割序列点,则在所述分割序列点对所述流量序列进行分割,得到所述流量序列对应的流量时序片段。
3.根据权利要求2所述的流量的分类方法,其特征在于,所述流量分割模型的训练方法包括:
将所述历史流量模板库中的所述历史流量时序片段作为所述流量分割模型的训练样本,并获取所述历史流量时序片段的时序特征;
根据所述历史流量时序片段的时序特征,以及所述历史流量时序片段中各个序列点的分割类型,训练所述流量分割模型。
4.根据权利要求1所述的流量的分类方法,其特征在于,所述确定所述流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离,包括:
根据所述流量时序片段中各个序列点的值,以及所述历史流量模板库中的历史流量时序片段中各个序列点的值,得到所述流量时序片段与所述历史流量时序片段之间的动态时间弯曲距离;
将所述流量时序片段与所述历史流量时序片段之间的动态时间弯曲距离作为所述序列相似度距离。
5.根据权利要求1所述的流量的分类方法,其特征在于,所述根据所述流量时序片段与所述历史流量时序片段之间的序列相似度距离,确定所述流量时序片段的流量类型,包括:
判断所述流量时序片段与所述历史流量时序片段之间的序列相似度距离是否小于或等于相似度距离阈值;
若所述序列相似度距离小于或等于所述相似度距离阈值,则对所述流量时序片段以及所述历史流量时序片段进行聚类,并根据聚类后的所述历史流量时序片段对应的历史流量类型确定所述流量时序片段的流量类型;
若所述序列相似度距离大于所述相似度距离阈值,则将所述流量时序片段的流量类型确定为新增流量类型。
6.根据权利要求5所述的流量的分类方法,其特征在于,所述判断所述流量时序片段与所述历史流量时序片段之间的序列相似度距离是否小于或等于相似度距离阈值,包括:
获取所述流量时序片段与所述历史流量时序片段之间的动态时间弯曲距离的拐点个数;
若所述拐点个数小于或等于拐点阈值,则判定所述流量时序片段与所述历史流量时序片段之间的序列相似度距离小于或等于相似度距离阈值。
7.根据权利要求5所述的流量的分类方法,其特征在于,所述方法还包括:
若所述流量时序片段的流量类型为所述历史流量类型,则根据所述流量时序片段更新所述历史流量类型对应的历史流量时序片段的中心曲线;
若所述流量时序片段的流量类型为所述新增流量类型,则根据所述流量时序片段在所述历史流量模板库中生成所述新增流量类型对应的中心曲线。
8.根据权利要求5所述的流量的分类方法,其特征在于,所述方法还包括:
若所述流量时序片段的流量类型为所述历史流量类型中的异常流量类型,则根据所述异常流量类型触发对应的异常预警信息。
9.一种流量的分类装置,其特征在于,包括:
流量序列分割模块,用于获取从客户端采集的流量序列,并根据预先训练的流量分割模型对所述流量序列进行分割,得到所述流量序列对应的流量时序片段;
相似距离确定模块,用于确定所述流量时序片段与历史流量模板库中的历史流量时序片段之间的序列相似度距离;
流量类型确定模块,用于根据所述流量时序片段与所述历史流量时序片段之间的序列相似度距离,确定所述流量时序片段的流量类型。
10.一种电子设备,其特征在于,包括:
处理器;以及
存储器,用于存储一个或多个程序,当所述一个或多个程序被所述处理器执行时,使得所述处理器实现如权利要求1至8中任一项所述的流量的分类方法。
11.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1至8中任一项所述的流量的分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111080244.1A CN113705726A (zh) | 2021-09-15 | 2021-09-15 | 流量的分类方法、装置、电子设备及计算机可读介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111080244.1A CN113705726A (zh) | 2021-09-15 | 2021-09-15 | 流量的分类方法、装置、电子设备及计算机可读介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113705726A true CN113705726A (zh) | 2021-11-26 |
Family
ID=78660914
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111080244.1A Pending CN113705726A (zh) | 2021-09-15 | 2021-09-15 | 流量的分类方法、装置、电子设备及计算机可读介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113705726A (zh) |
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114760103A (zh) * | 2022-03-21 | 2022-07-15 | 广州大学 | 一种工业控制系统异常检测系统、方法、设备及存储介质 |
CN115408449A (zh) * | 2022-10-28 | 2022-11-29 | 支付宝(杭州)信息技术有限公司 | 一种用户行为的处理方法、装置及设备 |
CN116383190A (zh) * | 2023-05-15 | 2023-07-04 | 青岛场外市场清算中心有限公司 | 一种海量大数据智能清洗方法及系统 |
CN117057819A (zh) * | 2023-08-15 | 2023-11-14 | 泰华智慧产业集团股份有限公司 | 一种雨水管网污水排放溯源分析方法及系统 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8418249B1 (en) * | 2011-11-10 | 2013-04-09 | Narus, Inc. | Class discovery for automated discovery, attribution, analysis, and risk assessment of security threats |
CN110391958A (zh) * | 2019-08-15 | 2019-10-29 | 北京中安智达科技有限公司 | 一种对网络加密流量自动进行特征提取和识别的方法 |
CN110443657A (zh) * | 2019-08-19 | 2019-11-12 | 泰康保险集团股份有限公司 | 客户流量数据处理方法、装置、电子设备及可读介质 |
CN111209959A (zh) * | 2020-01-05 | 2020-05-29 | 西安电子科技大学 | 基于数据包时序的加密网页流量分割点识别方法 |
CN111401609A (zh) * | 2020-03-04 | 2020-07-10 | 平安科技(深圳)有限公司 | 车流量时间序列的预测方法及预测装置 |
CN111540196A (zh) * | 2020-03-25 | 2020-08-14 | 武汉纵横智慧城市股份有限公司 | 基于高点视频的车流量预警方法、设备、存储介质及装置 |
US20200328947A1 (en) * | 2017-10-26 | 2020-10-15 | Nec Corporation | Traffic analysis apparatus, system, method, and program |
CN112532643A (zh) * | 2020-12-07 | 2021-03-19 | 长春工程学院 | 基于深度学习的流量异常检测方法、系统、终端及介质 |
US20210209938A1 (en) * | 2020-09-25 | 2021-07-08 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus, system, and computer-readable medium for traffic pattern prediction |
-
2021
- 2021-09-15 CN CN202111080244.1A patent/CN113705726A/zh active Pending
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8418249B1 (en) * | 2011-11-10 | 2013-04-09 | Narus, Inc. | Class discovery for automated discovery, attribution, analysis, and risk assessment of security threats |
US20200328947A1 (en) * | 2017-10-26 | 2020-10-15 | Nec Corporation | Traffic analysis apparatus, system, method, and program |
CN110391958A (zh) * | 2019-08-15 | 2019-10-29 | 北京中安智达科技有限公司 | 一种对网络加密流量自动进行特征提取和识别的方法 |
CN110443657A (zh) * | 2019-08-19 | 2019-11-12 | 泰康保险集团股份有限公司 | 客户流量数据处理方法、装置、电子设备及可读介质 |
CN111209959A (zh) * | 2020-01-05 | 2020-05-29 | 西安电子科技大学 | 基于数据包时序的加密网页流量分割点识别方法 |
CN111401609A (zh) * | 2020-03-04 | 2020-07-10 | 平安科技(深圳)有限公司 | 车流量时间序列的预测方法及预测装置 |
WO2021174811A1 (zh) * | 2020-03-04 | 2021-09-10 | 平安科技(深圳)有限公司 | 车流量时间序列的预测方法及预测装置 |
CN111540196A (zh) * | 2020-03-25 | 2020-08-14 | 武汉纵横智慧城市股份有限公司 | 基于高点视频的车流量预警方法、设备、存储介质及装置 |
US20210209938A1 (en) * | 2020-09-25 | 2021-07-08 | Beijing Baidu Netcom Science And Technology Co., Ltd. | Method, apparatus, system, and computer-readable medium for traffic pattern prediction |
CN112532643A (zh) * | 2020-12-07 | 2021-03-19 | 长春工程学院 | 基于深度学习的流量异常检测方法、系统、终端及介质 |
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114760103A (zh) * | 2022-03-21 | 2022-07-15 | 广州大学 | 一种工业控制系统异常检测系统、方法、设备及存储介质 |
CN114760103B (zh) * | 2022-03-21 | 2023-10-31 | 广州大学 | 一种工业控制系统异常检测系统、方法、设备及存储介质 |
CN115408449A (zh) * | 2022-10-28 | 2022-11-29 | 支付宝(杭州)信息技术有限公司 | 一种用户行为的处理方法、装置及设备 |
CN115408449B (zh) * | 2022-10-28 | 2023-03-07 | 支付宝(杭州)信息技术有限公司 | 一种用户行为的处理方法、装置及设备 |
CN116383190A (zh) * | 2023-05-15 | 2023-07-04 | 青岛场外市场清算中心有限公司 | 一种海量大数据智能清洗方法及系统 |
CN116383190B (zh) * | 2023-05-15 | 2023-08-25 | 青岛场外市场清算中心有限公司 | 一种海量金融交易大数据智能清洗方法及系统 |
CN117057819A (zh) * | 2023-08-15 | 2023-11-14 | 泰华智慧产业集团股份有限公司 | 一种雨水管网污水排放溯源分析方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113705726A (zh) | 流量的分类方法、装置、电子设备及计算机可读介质 | |
CN108460397B (zh) | 设备故障类型的分析方法、装置、储存介质和电子设备 | |
CN111401609A (zh) | 车流量时间序列的预测方法及预测装置 | |
CN110991657A (zh) | 一种基于机器学习的异常样本检测方法 | |
CN111026653B (zh) | 异常程序行为检测方法、装置、电子设备和存储介质 | |
EP3333757B1 (en) | Predictive anomaly detection | |
CN111538311B (zh) | 一种基于数据挖掘的机械设备柔性多状态自适应预警方法及装置 | |
CN111105786B (zh) | 一种多采样率语音识别方法、装置、系统及存储介质 | |
CN112686521B (zh) | 一种风控规则调优方法和系统 | |
CN107729469A (zh) | 用户挖掘方法、装置、电子设备及计算机可读存储介质 | |
CN109002810A (zh) | 模型评价方法、雷达信号识别方法及对应装置 | |
CN111796957A (zh) | 基于应用日志的交易异常根因分析方法及系统 | |
CN112115996B (zh) | 图像数据的处理方法、装置、设备及存储介质 | |
CN112883990A (zh) | 数据分类方法及装置、计算机存储介质、电子设备 | |
CN115391160B (zh) | 一种异常变更检测方法、装置、设备及存储介质 | |
CN114328106A (zh) | 日志数据处理方法、装置、设备及存储介质 | |
CN113723555A (zh) | 异常数据的检测方法及装置、存储介质、终端 | |
CN116186603A (zh) | 异常用户的识别方法及装置、计算机存储介质、电子设备 | |
CN112994960B (zh) | 业务数据异常检测方法、装置及计算设备 | |
CN112888008B (zh) | 基站异常检测方法、装置、设备及存储介质 | |
CN116483602A (zh) | 一种异常检测方法、装置以及计算机存储介质 | |
CN115829160A (zh) | 一种时序异常预测方法、装置、设备及存储介质 | |
CN115963344A (zh) | 故障检测方法、装置、电子设备及存储介质 | |
CN113377630B (zh) | 一种通用的kpi异常检测框架实现方法 | |
CN111798237B (zh) | 基于应用日志的异常交易诊断方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |