CN114201955B

CN114201955B - 互联网流量平台监测方法和系统

Info

Publication number: CN114201955B
Application number: CN202111429381.1A
Authority: CN
Inventors: 苏长君; 曾祥禄
Original assignee: Beijing Guorui Digital Intelligence Technology Co ltd
Current assignee: Beijing Guorui Digital Intelligence Technology Co ltd
Priority date: 2021-11-29
Filing date: 2021-11-29
Publication date: 2024-06-25
Anticipated expiration: 2041-11-29
Also published as: CN114201955A

Abstract

本发明提供一种互联网流量平台监测方法和系统，通过搭建云计算平台，获取互联网数据流，按照对象标识字符的相似度聚类，将相似的对象聚类成簇，并结合时间戳得到带有方向的簇状结构，进一步句法分析和语义分析特征向量，得到信息和话题的大类，从而更加容易判断是否合规，对于不合规的数据流调用云计算溯源，利用边缘和中心两种不同的实体服务器，极大地提高了防护效率。

Description

互联网流量平台监测方法和系统

技术领域

本申请涉及网络多媒体领域，尤其涉及一种互联网流量平台监测方法和系统。

背景技术

随着网络技术的发展，需要在安全管理过程中，增加更为详细的技术和方法，可以针对安全隐患进行全面细致的监控和把关，充分利用流量分析的优势。同时，云计算与流量监测天生可以相互契合，如何在流量平台监测中用好云计算也是本领域的重要课题。

因此，急需一种针对性的互联网流量平台监测的方法和系统。

发明内容

本发明的目的在于提供一种互联网流量平台监测方法和系统，通过搭建云计算平台，获取互联网数据流，按照对象标识字符的相似度聚类，将相似的对象聚类成簇，并结合时间戳得到带有方向的簇状结构，进一步句法分析和语义分析特征向量，得到信息和话题的大类，从而更加容易判断是否合规，对于不合规的数据流调用云计算溯源，利用边缘和中心两种不同的实体服务器，极大地提高了防护效率。

第一方面，本申请提供一种互联网流量平台监测方法，所述方法包括：

在服务器上搭建云计算平台，构建句法模型和语义分析模型，所述句法模型和语义分析模型分别位于云计算平台的不同核实体上，所述核实体是所述云计算平台中处于中心地位的实体服务器；

根据获取策略，获取互联网平台的数据流，提取特征向量和对象标识，将所述对象标识转换为字符串，将所述特征向量输入句法模型进行断句，得到词分量；

按字符分解对象标识的所述字符串，根据字符的相似度进行聚类，将相似度高于阈值的若干个对象标识组成簇，并相似度高低和时间戳形成轨迹，所述簇和轨迹构成带有方向的簇状结构；

将所述词分量输入语义分析模型，输出词含义，所述词含义为去除语气词、简洁、含义唯一、使用大类的单词的语句，将所述词含义重组成新的语句，向量化后得到第二特征向量；

计算若干个所述第二特征向量之间的相似度，将相似度高于第二阈值的第二特征向量组成类；

判断所述词含义中是否包括指定的关键词，如果是则继续判断该词含义所在的语句是否形成了指定的含义，如果该语句形成了指定的含义，则认定对应的第二特征向量属于需要报警的情形，针对所述第二特征向量所属的类一起发出报警消息；如果该语句没有形成指定的含义，则认定对应的第二特征向量合规；

所述云计算平台调用边缘地位的实体服务器，溯源对应的词分量和所述簇状结构，将疑似轨迹和疑似源点发送给中心地位的实体服务器，所述中心地位的实体服务器调用所述云计算平台的计算能力，确定对应数据流的源点，通知所述边缘地位的实体服务器屏蔽该源点。

结合第一方面，在第一方面第一种可能的实现方式中，所述溯源还包括风险评估、攻击关联分析和态势感知。

结合第一方面，在第一方面第二种可能的实现方式中，所述获取互联网平台的数据流包括对所述数据流的编解码。

结合第一方面，在第一方面第三种可能的实现方式中，所述语义分析模型和句法模型的内核均使用神经网络模型。

第二方面，本申请提供一种互联网流量平台监测系统，所述系统包括处理器以及存储器：

所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

所述处理器用于根据所述程序代码中的指令执行第一方面四种可能中任一项所述的方法。

第三方面，本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面四种可能中任一项所述的方法。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对实施例中所需要使用的附图作简单地介绍，显而易见地，对于本领域普通技术人员而言，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本发明方法的流程图。

具体实施方式

下面结合附图对本发明的优选实施例进行详细阐述，以使本发明的优点和特征能更易于被本领域技术人员理解，从而对本发明的保护范围做出更为清楚明确的界定。

图1为本申请提供的互联网流量平台监测方法的流程图，包括：

在一些优选实施例中，所述溯源还包括风险评估、攻击关联分析和态势感知。

在一些优选实施例中，所述获取互联网平台的数据流包括对所述数据流的编解码。

在一些优选实施例中，所述语义分析模型和句法模型的内核均使用神经网络模型。

本申请提供一种互联网流量平台监测系统，所述系统包括：所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行第一方面所有实施例中任一项所述的方法。

本申请提供一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行第一方面所有实施例中任一项所述的方法。

具体实现中，本发明还提供一种计算机存储介质，其中，该计算机存储介质可以存储有程序，该程序执行时可包括本发明各个实施例中的部分或全部步骤。所述的存储介质可以为磁碟、光盘、只读存储记忆体(简称：ROM)或随机存储记忆体(简称：RAM)等。

本领域的技术人员可以清楚地了解到本发明实施例中的技术可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解，本发明实施例中的技术方案本质上或者对现有技术做出贡献的部分可以以软件产品的形式体现出来，该计算机软件产品可以存储在存储介质中，如ROM/RAM、磁碟、光盘等，包括若干指令用以使得一台计算机设备(可以是个人计算机、服务器、或者网络设备等)执行本发明各个实施例或者实施例的某些部分所述的方法。

本说明书各个实施例之间相同相似的部分互相参见即可。尤其，对于实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例中的说明即可。

以上所述的本发明实施方式并不构成对本发明保护范围的限定。

Claims

1.一种互联网流量平台监测方法，其特征在于，所述方法包括：

按字符分解对象标识的所述字符串，根据字符的相似度进行聚类，将相似度高于阈值的若干个对象标识组成簇，并按照相似度高低和时间戳形成轨迹，所述簇和轨迹构成带有方向的簇状结构；

2.根据权利要求1所述的方法，其特征在于：所述溯源还包括风险评估、攻击关联分析和态势感知。

3.根据权利要求1-2任一项所述的方法，其特征在于：所述获取互联网平台的数据流包括对所述数据流的编解码。

4.根据权利要求3所述的方法，其特征在于：所述语义分析模型和句法模型的内核均使用神经网络模型。

5.一种互联网流量平台监测系统，其特征在于，所述系统包括处理器以及存储器：

所述处理器用于根据所述程序代码中的指令执行实现权利要求1-4任一项所述的方法。

6.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行实现权利要求1-4任一项所述的方法。