CN108429802B - 物联网设备信息获取方法及装置 - Google Patents

物联网设备信息获取方法及装置 Download PDF

Info

Publication number
CN108429802B
CN108429802B CN201810188373.4A CN201810188373A CN108429802B CN 108429802 B CN108429802 B CN 108429802B CN 201810188373 A CN201810188373 A CN 201810188373A CN 108429802 B CN108429802 B CN 108429802B
Authority
CN
China
Prior art keywords
internet
equipment
things
flow
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810188373.4A
Other languages
English (en)
Other versions
CN108429802A (zh
Inventor
刘中金
李勇
肖少然
方喆君
张晓明
何跃鹰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
National Computer Network and Information Security Management Center
Original Assignee
Tsinghua University
National Computer Network and Information Security Management Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University, National Computer Network and Information Security Management Center filed Critical Tsinghua University
Priority to CN201810188373.4A priority Critical patent/CN108429802B/zh
Publication of CN108429802A publication Critical patent/CN108429802A/zh
Application granted granted Critical
Publication of CN108429802B publication Critical patent/CN108429802B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L41/00Arrangements for maintenance, administration or management of data switching networks, e.g. of packet switching networks
    • H04L41/14Network analysis or design
    • H04L41/142Network analysis or design using statistical or mathematical methods
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L43/00Arrangements for monitoring or testing data switching networks
    • H04L43/50Testing arrangements
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L63/00Network architectures or network communication protocols for network security
    • H04L63/14Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic
    • H04L63/1408Network architectures or network communication protocols for network security for detecting or protecting against malicious traffic by monitoring network traffic

Abstract

本发明提供一种物联网设备信息获取方法及装置。该方法包括:根据获取的流量数据序列及其与物联网设备的对应关系,获取部分物联网设备的设备信息,将设备信息已知物联网设备的流量特征分为预设数目的流量模式,并分别获取设备信息已知物联网设备的流量特征和设备信息未知物联网设备的流量特征在这些流量模式上的模式分布向量,根据设备信息未知物联网设备与设备信息已知物联网设备的模式分布向量相似度,将相似度最大值对应的设备信息已知物联网设备的设备信息作为设备信息未知物联网设备的设备信息,从而能够高效地获取物联网设备的设备信息,克服对云平台的流量规则进行分析以获得相应物联网设备的设备信息十分费时费力的问题。

Description

物联网设备信息获取方法及装置
技术领域
本发明涉及互联网技术领域,更具体地,涉及一种物联网设备信息获取方法及装置。
背景技术
物联网,即物物相连的互联网,能够将不同物联网设备连接起来进行信息交互实现特定功能。当物联网中的物联网设备接入云平台,便可实现与云应用程序的交互以及物联网设备间的交互。由于网络中存在潜在的攻击,因此,接入云平台的物联网设备存在安全风险。为此,各云平台通常利用流量安全分析系统基于数据分析探测潜在的网络安全风险。鉴于各云平台具体采用的技术手段较大差异、流量安全分析能力也参差不齐,针对各云平台以及与之连接的物联网设备的大型综合流量安全分析系统应运而生。
该大型综合流量安全分析系统可用于对各云平台以及与各云平台连接的物联网设备进行流量监测。而对物联网设备进行流量监测的前提是获知物联网设备的设备信息。一般来说,在物联网设备与云平台通信的过程中,传输的流量中会包含物联网设备的类型、型号等设备信息。通过对云平台的流量规则进行分析,就可以获得相应物联网设备的设备信息。但对云平台的流量规则进行分析,通常需要制定复杂的匹配规则,再通过人工根据匹配规则检查每一个流量以获取物联网设备的设备类型,十分费时费力。
发明内容
本发明提供一种物联网设备信息获取方法及装置,以克服现有技术对云平台的流量规则进行分析以获得相应物联网设备的设备信息十分费时费力的问题。
根据本发明的第一方面,提供一种物联网设备信息获取方法,该方法包括:步骤1,获取若干目标流量数据包,根据所述若干目标流量数据包,生成若干流量数据序列,并提取各所述流量数据序列的流量特征;所述若干目标流量数据包由若干云平台和物联网设备相互通信产生;步骤2,根据所述若干流量数据序列中的IP地址,获取各所述流量数据序列与各所述物联网设备的对应关系,并根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息;步骤3,将设备信息已知的所述物联网设备对应流量数据序列的流量特征,利用相似度采用聚类算法分为预设数目的流量模式,并根据所述设备信息已知的所述物联网设备对应流量数据序列的流量特征所归属的所述流量模式,获取所述设备信息已知的所述物联网设备的模式分布向量;步骤4,对于设备信息未知的所述物联网设备,根据该物联网设备对应流量数据序列的流量特征与各个所述流量模式之间的相似度,获取该物联网设备的模式分布向量,并根据所述设备信息已知的所述物联网设备的模式分布向量和物联网设备数据库中物联网设备的模式分布向量与该物联网设备的模式分布向量的相似度的最大值,获取该物联网设备的设备信息。
其中,在步骤1中,所述获取若干目标流量数据包,具体包括:获取流量数据包,若判断获知所述流量数据包中的IP地址为所述云平台的服务器的IP地址,当所述云平台和所述物联网设备通过固网连接,保留所述流量数据包作为所述目标流量数据包;当所述云平台和所述物联网设备通过蜂窝网连接,获取所述物联网设备的设备类型,若所述设备类型满足预设条件,保留所述流量数据包作为所述目标流量数据包。
其中,在步骤1中,所述根据所述若干目标流量数据包,生成若干流量数据序列,具体包括:获取所述若干目标流量数据包的五元组信息和时间戳;将所述五元组信息相同的所述目标流量数据包根据所述时间戳排序,生成流量数据序列。
其中,在步骤1中,所述流量数据序列的流量特征主要包括:流的连接信息、数据包长度相关特征、数据包的处理时延特征、数据包间时间间隔数据、数据包时间序列相关特征和会话整体特征。
其中,在步骤2中,所述根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息,具体包括:对于所述若干流量数据序列中每一流量数据序列,根据该流量数据序列中的IP地址和所述云平台的服务器的IP地址,获知该流量数据序列所属的云平台;根据该流量数据序列及其所属的云平台的流量数据序列规则库,提取该流量数据序列对应物联网设备的唯一标识符;若能够得到唯一标识符,根据该流量数据序列中的净荷,获取该流量数据序列对应物联网设备的地理位置、物联网设备名称和型号,并将物联网设备的唯一标识符、IP、地理位置、物联网设备名称和型号作为设备信息。
其中,在步骤3中,所述相似度为两个流量特征的时间序列相似度、频谱相似度与频繁项序列相似度之和。
其中,所述方法还包括:若所述物联网设备数据库不包含所述设备信息已知的所述物联网设备,则将所述设备信息已知的所述物联网设备对应流量特征序列的特征向量以及设备信息存入所述物联网设备数据库;若所述物联网设备数据库包含所述设备信息已知的所述物联网设备,将所述设备信息已知的所述物联网设备对应流量特征序列的特征向量以及设备信息与所述设备信息已知的所述物联网设备在所述物联网设备数据库中对应信息进行合并。
其中,所述模式分布向量的元素为物联网设备对应流量数据序列的流量特征归属于各所述流量模式的数目与物联网设备对应流量数据序列的流量特征总数之比。
其中,所述模式分布向量表达式为:
Figure BDA0001590985080000041
其中,
Figure BDA0001590985080000042
Pti为物联网设备对应流量数据序列的流量特征归属于第i类的数目。
根据本发明的第二方面,提供一种物联网设备信息获取装置,包括:流量数据序列及其特征获取模块、第一设备信息获取模块、模式分布向量获取模块和第二设备信息获取模块;所述流量数据序列及其特征获取模块,用于获取若干目标流量数据包,根据所述若干目标流量数据包,生成若干流量数据序列,并提取各所述流量数据序列的流量特征;所述若干目标流量数据包由若干云平台和物联网设备相互通信产生;所述第一设备信息获取模块,用于根据所述若干流量数据序列中的IP地址,获取各所述流量数据序列与各所述物联网设备的对应关系,并根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息;所述模式分布向量获取模块,用于将设备信息已知的所述物联网设备对应流量数据序列的流量特征,利用相似度采用聚类算法分为预设数目的流量模式,并根据所述设备信息已知的所述物联网设备对应流量数据序列的流量特征所归属的所述流量模式,获取所述设备信息已知的所述物联网设备的模式分布向量;所述第二设备信息获取模块,用于对于设备信息未知的所述物联网设备,根据该物联网设备对应流量数据序列的流量特征与各个所述流量模式之间的相似度,获取该物联网设备的模式分布向量,并根据所述设备信息已知的所述物联网设备的模式分布向量和物联网设备数据库中物联网设备的模式分布向量与该物联网设备的模式分布向量的相似度的最大值,获取该物联网设备的设备信息。
本发明提出的物联网设备信息获取方法及装置,通过先获取流量数据序列及其与物联网设备的对应关系,并根据流量数据序列及其与物联网设备的对应关系,获取部分物联网设备的设备信息,将设备信息已知物联网设备的流量特征进行分类,获取设备信息已知物联网设备的流量特征在这些流量模式上的模式分布向量以及设备信息未知物联网设备的流量特征在这些流量模式上的模式分布向量,根据设备信息未知物联网设备与设备信息已知物联网设备的模式分布向量相似度,将相似度最大值对应的设备信息已知物联网设备的设备信息作为设备信息未知物联网设备的设备信息,从而能够高效地获取物联网设备的设备信息,克服对云平台的流量规则进行分析以获得相应物联网设备的设备信息十分费时费力的问题。
附图说明
图1为根据本发明实施例的一种物联网设备信息获取方法流程图;
图2为根据本发明实施例的物联网设备与云平台通过蜂窝网连接时通信产生的流量数据包中信息示意图;
图3为根据本发明实施例的通过GSMA数据库获取设备的类型的流程图;
图4为根据本发明实施例的由流量数据包生成流量数据序列的流程图;
图5为根据本发明实施例的通过流量数据序列中的IP地址获取的物联网设备设备信息的示意图;
图6为根据本发明实施例的一种物联网设备信息获取装置示意图。
具体实施方式
下面结合附图和实施例,对本发明的具体实施方式作进一步详细描述。以下实施例用于说明本发明,但不用来限制本发明的范围。
如图1所示,根据本发明的第一方面,提供一种物联网设备信息获取方法,该方法包括:步骤1,获取若干目标流量数据包,根据所述若干目标流量数据包,生成若干流量数据序列,并提取各所述流量数据序列的流量特征;所述若干目标流量数据包由若干云平台和物联网设备相互相互通信产生;步骤2,根据所述若干流量数据序列中的IP地址,获取各所述流量数据序列与各所述物联网设备的对应关系,并根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息;步骤3,将设备信息已知的所述物联网设备对应流量数据序列的流量特征,利用相似度采用聚类算法分为预设数目的流量模式,并根据所述设备信息已知的所述物联网设备对应流量数据序列的流量特征所归属的所述流量模式,获取所述设备信息已知的所述物联网设备的模式分布向量;步骤4,对于设备信息未知的所述物联网设备,根据该物联网设备对应流量数据序列的流量特征与各个所述流量模式之间的相似度,获取该物联网设备的模式分布向量,并根据所述设备信息已知的所述物联网设备的模式分布向量和物联网设备数据库中物联网设备的模式分布向量与该物联网设备的模式分布向量的相似度的最大值,获取该物联网设备的设备信息。
在本实施例中,物联网设备与云平台之间可以通过蜂窝网连接也可以通过固网连接。如图2所示,通过蜂窝网连接时,流量数据包根据运营商入网要求还封装有一层标识信息,包括国际移动用户识别码(IMSI)和国际移动设备身份码(IMEI)等。在流量数据包的采集过程中,仅采集云平台与物联网设备相互通信时产生的流量数据包作为目标流量数据包。通过蜂窝网连接和通过固网连接时分别需采用对应的装置进行流量数据包的获取。这些流量数据包对应着多个会话,将这些包组合起来生成的每个流量数据序列对应着一个会话。此会话可以为TCP、ModBus、ICMP或UDP会话等。
在本实施例中,获取的若干流量数据序列可能对应多个物联网设备。为了获取每个物联网设备的设备信息,需要获取每个物联网设备对应的流量数据序列。由于每个流量数据序列都包含了物联网设备的IP地址,因此,根据物联网设备IP地址很容易获取每个物联网设备对应的流量数据序列。在这些流量数据序列中,有的流量数据序列可提取出设备信息,因此,能够提取出设备信息的流量数据序列对应物联网设备便成了设备信息已知的物联网设备。
在本实施例中,设备信息已知的物联网设备对应流量数据序列的流量特征体现了该物联网设备的同类物联网设备与云平台通信时传输的数据的若干特点。通过将这些流量特征利用聚类算法进行分类得到流量模式进而获取模式分布向量,可以了解该物联网设备的同类物联网设备与云平台通信时传输的数据的特点所侧重的方向,即传输的数据对应的模式。通过将设备信息已知的物联网设备的模式分布向量以及物联网设备数据库中物联网设备的模式分布向量分别与设备信息未知的物联网设备的模式分布向量求相似度,将模式相似度最大的物联网设备看做设备信息未知的物联网设备的同类物联网设备,从而获取设备信息未知的物联网设备的设备信息。
此外,物联网设备发送的流量数据包中包含了与设备通信的对象的IP地址以及通信所使用的协议类型等信息。通过这些信息,可以获知物联网设备所属的云平台,从而不仅有助于了解云平台的相关使用情况,例如:云平台连接的物联网设备的数量、物联网设备的类型,还有助于获得物联网设备所使用的云平台的相关信息。
本发明提出的物联网设备信息获取方法,通过先获取流量数据序列及其与物联网设备的对应关系,并根据流量数据序列及其与物联网设备的对应关系,获取部分物联网设备的设备信息,将设备信息已知物联网设备的流量特征进行分类,获取设备信息已知物联网设备的流量特征在这些流量模式上的模式分布向量以及设备信息未知物联网设备的流量特征在这些流量模式上的模式分布向量,根据设备信息未知物联网设备与设备信息已知物联网设备的模式分布向量相似度,将相似度最大值对应的设备信息已知物联网设备的设备信息作为设备信息未知物联网设备的设备信息,从而能够高效地获取物联网设备的设备信息,克服对云平台的流量规则进行分析以获得相应物联网设备的设备信息十分费时费力的问题。
作为一种可选实施例,在步骤1中,所述获取若干目标流量数据包,具体包括:获取流量数据包,若判断获知所述流量数据包中的IP地址为所述云平台的服务器的IP地址,当所述云平台和所述物联网设备通过固网连接,保留所述流量数据包作为所述目标流量数据包;当所述云平台和所述物联网设备通过蜂窝网连接,获取所述物联网设备的设备类型,若所述设备类型满足预设条件,保留所述流量数据包作为所述目标流量数据包。
在本实施例中,若流量数据包中的IP地址为所述云平台的服务器的IP地址,则该流量数据包为云平台与物联网设备相互通信产生的。通过蜂窝网连接时,流量数据包根据运营商入网要求还封装有一层标识信息,包括国际移动设备身份码(IMEI),而IMEI的前6位即型号核准号码(TAC)。因此,可以通过查询GSM协会的GSMA数据库获取设备的类型。通过该方式查询到的设备类型有8种可能类型,如图3所示,进而可据此判断是否为物联网设备,若为物联网设备,保留所述流量数据包作为所述目标流量数据包。
作为一种可选实施例,在步骤1中,所述根据所述若干目标流量数据包,生成若干流量数据序列,具体包括:获取所述若干目标流量数据包的五元组信息和时间戳;将所述五元组信息相同的所述目标流量数据包根据所述时间戳排序,生成流量数据序列。
在本实施例中,五元组信息包括:源地址,目的地址,源端口,目的端口和协议号。五元组信息相同的目标流量数据包归为一组,对应一个TCP会话,将这些目标流量数据包按照时间戳排序,生成的流量数据序列便包括了对应会话不同时刻的所有流量数据包,该过程如图4所示。此会话可以为TCP、ModBus、ICMP或UDP会话等。
作为一种可选实施例,在步骤1中,所述流量数据序列的流量特征主要包括:流的连接信息、数据包长度相关特征、数据包的处理时延特征、数据包间时间间隔数据、数据包时间序列相关特征和会话整体特征。
表1
Figure BDA0001590985080000091
Figure BDA0001590985080000101
在本实施例中,流的连接信息,主要包含五元组信息,在通过蜂窝网连接时,还包含物联网设备的IMEI信息等内容。此外,流的连接信息还包括对应的云平台信息,使用的云平台接口信息。数据包长度相关特征,包括流量数据包的最大长度,最短长度,平均长度等特征。数据包的处理时延特征反映了服务器对数据进行处理的相关信息,从侧面体现了数据包内部业务数据的特征。数据包间时间间隔数据,度量相邻两个数据包间的时间间隔,体现了物联网设备与服务器进行通信的相关频率信息,这与物联网设备运行的业务类型,执行的功能密切相关。数据包时间序列相关特征,体现整个会话期间流量的时域信息,体现了物联网设备固有的通信模式。会话整体特征包括会话的持续时间等特征,与物联网设备的功能、型号密切相关,对于判断设备类型密切相关。以上信息对应包含的具体信息如表1所示。
作为一种可选实施例,在步骤2中,所述根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息,具体包括:对于所述若干流量数据序列中每一流量数据序列,根据该流量数据序列中的IP地址和所述云平台的服务器的IP地址,获知该流量数据序列所属的云平台;根据该流量数据序列及其所属的云平台的流量数据序列规则库,提取该流量数据序列对应物联网设备的唯一标识符;若能够得到唯一标识符,根据该流量数据序列中的净荷,获取该流量数据序列对应物联网设备的地理位置、物联网设备名称和型号,并将物联网设备的唯一标识符、IP、地理位置、物联网设备名称和型号作为设备信息。
在本实施例中,假设有N个云平台,每个平台对应的IP地址数据库为IPDBn(n=1,2,…,N),则当流量数据序列中的源IP地址和目的IP地址与各个平台对应的IP地址数据库为IPDBn(n=1,2,…,N)进行匹配,获取流量数据序列所属的云平台。该过程代码如下:
for n=1 to N
if(IPsrc∈IPDBn||IPdst∈IPDBn)
then IoT-Platform-flag=n。
确定流量数据序列所属的云平台后,根据该云平台的流量数据序列规则库,得到物联网设备的唯一标识符。以针对HTTP协议开发的云平台流量数据序列规则库为例,针对HTTP数据包的URL,应用正则表达式:.*/devices/(\d)+/.*→Did,提取出一个任意长度的十进制数字组成的ID,即物联网设备唯一标识Did。进一步的,对流量数据序列中的净荷payload进行识别,获取该流量数据序列对应物联网设备的地理位置、物联网设备名称和型号的代码如下:
{
"title":"mydevice",//物联网设备名
"desc":"some description",//物联网设备描述
"location":{"lon":96,"lat":28,"ele":70},//物联网设备位置{"纬度","经度","高度"}
}
所得的设备信息格式如图5所示。
作为一种可选实施例,在步骤3中,所述相似度为两个流量特征的时间序列相似度、频谱相似度与频繁项序列相似度之和。
在本实施例中,相似度的计算公式如下:
Sim(Fi,Fj)=TimeSim(Fi,Fj)+SpectrumSim(Fi,Fj)+FreqSim(Fi,Fj)
其中,TimeSim(Fi,Fj)为两个流的时间序列相似度,SpectrumSim(Fi,Fj)为两个流的时间序列的傅里叶频谱相似度,FreqSim(Fi,Fj)为两个流的频繁项序列相似度。
作为一种可选实施例,所述方法还包括:若所述物联网设备数据库不包含所述设备信息已知的所述物联网设备,则将所述设备信息已知的所述物联网设备对应流量特征序列的特征向量以及设备信息存入所述物联网设备数据库;若所述物联网设备数据库包含所述设备信息已知的所述物联网设备,将所述设备信息已知的所述物联网设备对应流量特征序列的特征向量以及设备信息与所述设备信息已知的所述物联网设备在所述物联网设备数据库中对应信息进行合并。
在本实施例中,物联网设备数据库中包含设备信息数据库(存储内容如表2所示)、流量特征数据库(存储内容如表3所示)和设备类型
表2
数据字段 说明
ID 数据库主键
IMEI 设备的IMEI数据
Type 设备类型
Server 与设备通信对应的云平台
ServerIPs 与设备通信对应的云平台IP
MAC 设备MAC地址信息
FlowMods 设备流量模式
DeviceInfo 设备信息
BindIPs 设备使用的IP信息
流量模式向量 该设备对应的流量模式向量
表3
Figure BDA0001590985080000131
Figure BDA0001590985080000141
表4
数据内容 说明
ID 类型ID
Name 设备类型名称
Type 设备类型
Info 设备相关信息
FlowModelNum 该设备对应的流量模式数量
数据库(存储内容如表4所示)。
作为一种可选实施例,所述模式分布向量的元素为物联网设备对应流量数据序列的流量特征归属于各所述流量模式的数目与物联网设备对应流量数据序列的流量特征总数之比。
作为一种可选实施例,所述模式分布向量表达式为:
Figure BDA0001590985080000142
其中,
Figure BDA0001590985080000143
Pti为物联网设备t对应流量数据序列的流量特征归属于第i类的数目。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
如图6所示,根据本发明的第二方面,提供一种物联网设备信息获取装置,包括:流量数据序列及其特征获取模块、第一设备信息获取模块、模式分布向量获取模块和第二设备信息获取模块;所述流量数据序列及其特征获取模块,用于获取若干目标流量数据包,根据所述若干目标流量数据包,生成若干流量数据序列,并提取各所述流量数据序列的流量特征;所述若干目标流量数据包由若干云平台和物联网设备相互通信产生;所述第一设备信息获取模块,用于根据所述若干流量数据序列中的IP地址,获取各所述流量数据序列与各所述物联网设备的对应关系,并根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息;所述模式分布向量获取模块,用于将设备信息已知的所述物联网设备对应流量数据序列的流量特征,利用相似度采用聚类算法分为预设数目的流量模式,并根据所述设备信息已知的所述物联网设备对应流量数据序列的流量特征所归属的所述流量模式,获取所述设备信息已知的所述物联网设备的模式分布向量;所述第二设备信息获取模块,用于对于设备信息未知的所述物联网设备,根据该物联网设备对应流量数据序列的流量特征与各个所述流量模式之间的相似度,获取该物联网设备的模式分布向量,并根据所述设备信息已知的所述物联网设备的模式分布向量和物联网设备数据库中物联网设备的模式分布向量与该物联网设备的模式分布向量的相似度的最大值,获取该物联网设备的设备信息。
本发明提出的物联网设备信息获取装置,通过流量数据序列及其特征获取模块和第一设备信息获取模块,先获取流量数据序列及其与物联网设备的对应关系,并根据流量数据序列及其与物联网设备的对应关系,获取部分物联网设备的设备信息,通过模式分布向量获取模块和第二设备信息获取模块,将设备信息已知物联网设备的流量特征进行分类,获取设备信息已知物联网设备的流量特征在这些流量模式上的模式分布向量以及设备信息未知物联网设备的流量特征在这些流量模式上的模式分布向量,根据设备信息未知物联网设备与设备信息已知物联网设备的模式分布向量相似度,将相似度最大值对应的设备信息已知物联网设备的设备信息作为设备信息未知物联网设备的设备信息,从而能够高效地获取物联网设备的设备信息,克服对云平台的流量规则进行分析以获得相应物联网设备的设备信息十分费时费力的问题。
作为一种可选实施例,所述流量数据序列及其特征获取模块还具体用于获取流量数据包,若所述流量数据包中的IP地址为所述云平台的服务器的IP地址,当所述云平台和所述物联网设备通过固网连接,保留所述流量数据包作为所述目标流量数据包;当所述云平台和所述物联网设备通过蜂窝网连接,获取所述物联网设备的设备类型,若所述设备类型满足预设条件,保留所述流量数据包作为所述目标流量数据包。
作为一种可选实施例,所述流量数据序列及其特征获取模块还具体用于获取所述若干目标流量数据包的五元组信息和时间戳;将所述五元组信息相同的所述目标流量数据包根据所述时间戳排序,生成流量数据序列。
作为一种可选实施例,所述第一设备信息获取模块还具体用于所述根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息,具体包括:对于所述若干流量数据序列中每一流量数据序列,根据该流量数据序列中的IP地址和所述云平台的服务器的IP地址,获知该流量数据序列所属的云平台;根据该流量数据序列及其所属的云平台的流量数据序列规则库,提取该流量数据序列对应物联网设备的唯一标识符;若能够得到唯一标识符,根据该流量数据序列中的净荷,获取该流量数据序列对应物联网设备的地理位置、物联网设备名称和型号,并将物联网设备的唯一标识符、IP、地理位置、物联网设备名称和型号作为设备信息。
作为一种可选实施例,所述装置还包括:存储模块,用于若所述物联网设备数据库不包含所述设备信息已知的所述物联网设备,则将所述设备信息已知的所述物联网设备对应流量特征序列的特征向量以及设备信息存入所述物联网设备数据库。
最后,本发明的方法仅为较佳的实施方案,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (8)

1.一种物联网设备信息获取方法,其特征在于,包括:
步骤1,获取若干目标流量数据包,根据所述若干目标流量数据包,生成若干流量数据序列,并提取各所述流量数据序列的流量特征;所述若干目标流量数据包由若干云平台和物联网设备相互通信产生;
步骤2,根据所述若干流量数据序列中的IP地址,获取各所述流量数据序列与各所述物联网设备的对应关系,并根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息;
步骤3,将设备信息已知的所述物联网设备对应流量数据序列的流量特征,利用相似度采用聚类算法分为预设数目的流量模式,并根据所述设备信息已知的所述物联网设备对应流量数据序列的流量特征所归属的流量模式,获取所述设备信息已知的所述物联网设备的模式分布向量;
步骤4,对于设备信息未知的所述物联网设备,根据该物联网设备对应流量数据序列的流量特征与各个所述流量模式之间的相似度,获取该设备信息未知的物联网设备的模式分布向量,并通过将所述设备信息已知的所述物联网设备的模式分布向量以及物联网设备数据库中物联网设备的模式分布向量分别与设备信息未知的物联网设备的模式分布向量求相似度,将模式相似度最大的物联网设备看做设备信息未知的物联网设备的同类物联网设备,获取设备信息未知的物联网设备的设备信息;
在步骤3中,所述相似度为两个流量特征的时间序列相似度、频谱相似度与频繁项序列相似度之和;
所述流量模式表示传输的数据对应的模式;
所述模式分布向量的元素为物联网设备对应流量数据序列的流量特征归属于各所述流量模式的数目与物联网设备对应流量数据序列的流量总数之比。
2.根据权利要求1所述的方法,其特征在于,在步骤1中,所述获取若干目标流量数据包,具体包括:
获取流量数据包,若判断获知所述流量数据包中的IP地址为所述云平台的服务器的IP地址,当所述云平台和所述物联网设备通过固网连接,保留所述流量数据包作为所述目标流量数据包;当所述云平台和所述物联网设备通过蜂窝网连接,获取所述物联网设备的设备类型,若所述设备类型满足预设条件,保留所述流量数据包作为所述目标流量数据包;
其中,所述设备类型满足预设条件,具体包括:
所述设备类型为预设设备类型中的任意一种。
3.根据权利要求2所述的方法,其特征在于,在步骤1中,所述根据所述若干目标流量数据包,生成若干流量数据序列,具体包括:
获取所述若干目标流量数据包的五元组信息和时间戳;
将所述五元组信息相同的所述目标流量数据包根据所述时间戳排序,生成流量数据序列。
4.根据权利要求3所述的方法,其特征在于,在步骤1中,所述流量数据序列的流量特征主要包括:流的连接信息、数据包长度相关特征、数据包的处理时延特征、数据包间时间间隔数据、数据包时间序列相关特征和会话整体特征。
5.根据权利要求4所述的方法,其特征在于,在步骤2中,所述根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息,具体包括:
对于所述若干流量数据序列中每一流量数据序列,根据该流量数据序列中的IP地址和所述云平台的服务器的IP地址,获知该流量数据序列所属的云平台;
根据该流量数据序列及其所属的云平台的流量数据序列规则库,提取该流量数据序列对应物联网设备的唯一标识符;
若能够得到唯一标识符,根据该流量数据序列中的净荷,获取该流量数据序列对应物联网设备的地理位置、物联网设备名称和型号,并将物联网设备的唯一标识符、IP、地理位置、物联网设备名称和型号作为设备信息。
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:若所述物联网设备数据库不包含所述设备信息已知的所述物联网设备,则将所述设备信息已知的所述物联网设备对应流量特征序列的特征向量以及设备信息存入所述物联网设备数据库;若所述物联网设备数据库包含所述设备信息已知的所述物联网设备,将所述设备信息已知的所述物联网设备对应流量特征序列的特征向量以及设备信息与所述设备信息已知的所述物联网设备在所述物联网设备数据库中对应信息进行合并。
7.根据权利要求1所述的方法,其特征在于,所述模式分布向量表达式为:
Figure FDA0002698574060000031
其中,
Figure FDA0002698574060000032
Pti为物联网设备对应流量数据序列的流量特征归属于第i类的数目。
8.一种物联网设备信息获取装置,其特征在于,包括:流量数据序列及其特征获取模块、第一设备信息获取模块、模式分布向量获取模块和第二设备信息获取模块;
所述流量数据序列及其特征获取模块,用于获取若干目标流量数据包,根据所述若干目标流量数据包,生成若干流量数据序列,并提取各所述流量数据序列的流量特征;所述若干目标流量数据包由若干云平台和物联网设备相互通信产生;
所述第一设备信息获取模块,用于根据所述若干流量数据序列中的IP地址,获取各所述流量数据序列与各所述物联网设备的对应关系,并根据所述若干流量数据序列,提取设备信息,获取能够提取出设备信息的流量数据序列对应物联网设备的设备信息;
所述模式分布向量获取模块,用于将设备信息已知的所述物联网设备对应流量数据序列的流量特征,利用相似度采用聚类算法分为预设数目的流量模式,并根据所述设备信息已知的所述物联网设备对应流量数据序列的流量特征所归属的所述流量模式,获取所述设备信息已知的所述物联网设备的模式分布向量;
所述第二设备信息获取模块,用于对于设备信息未知的所述物联网设备,根据该物联网设备对应流量数据序列的流量特征与各个所述流量模式之间的相似度,获取该设备信息未知的物联网设备的模式分布向量,并通过将所述设备信息已知的所述物联网设备的模式分布向量和物联网设备数据库中物联网设备的模式分布向量分别与设备信息未知的物联网设备的模式分布向量求相似度,将模式相似度最大的物联网设备看做设备信息未知的物联网设备的同类物联网设备,获取设备信息未知的物联网设备的设备信息;
在所述模式分布向量获取模块中,所述相似度为两个流量特征的时间序列相似度、频谱相似度与频繁项序列相似度之和;
所述流量模式表示传输的数据对应的模式;
所述模式分布向量的元素为物联网设备对应流量数据序列的流量特征归属于各所述流量模式的数目与物联网设备对应流量数据序列的流量总数之比。
CN201810188373.4A 2018-03-07 2018-03-07 物联网设备信息获取方法及装置 Active CN108429802B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810188373.4A CN108429802B (zh) 2018-03-07 2018-03-07 物联网设备信息获取方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810188373.4A CN108429802B (zh) 2018-03-07 2018-03-07 物联网设备信息获取方法及装置

Publications (2)

Publication Number Publication Date
CN108429802A CN108429802A (zh) 2018-08-21
CN108429802B true CN108429802B (zh) 2021-01-26

Family

ID=63157591

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810188373.4A Active CN108429802B (zh) 2018-03-07 2018-03-07 物联网设备信息获取方法及装置

Country Status (1)

Country Link
CN (1) CN108429802B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110011926B (zh) * 2019-03-07 2022-08-23 新华三技术有限公司 一种调整报文发送时间的方法、装置、设备及存储介质
CN110505191B (zh) * 2019-04-18 2021-12-24 杭州海康威视数字技术股份有限公司 物联网僵尸网络节点的检测方法及装置
CN112383509B (zh) * 2020-10-21 2022-06-03 南京创维信息技术研究院有限公司 一种基于数据流的物联网设备安全监测系统及方法
CN112948784A (zh) * 2021-03-23 2021-06-11 中国信息通信研究院 物联网终端身份认证方法、计算机存储介质及电子设备

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103250376A (zh) * 2010-12-15 2013-08-14 国际商业机器公司 用于执行与通信网络的节点有关的预测分析的方法和系统
CN103297433A (zh) * 2013-05-29 2013-09-11 中国科学院计算技术研究所 基于网络数据流的http僵尸网络检测方法及系统
US8560511B1 (en) * 2011-07-20 2013-10-15 Google Inc. Fine-grain locking
CN106982209A (zh) * 2017-03-22 2017-07-25 北京匡恩网络科技有限责任公司 工业控制网络接入设备识别方法、装置、以及系统
CN107181724A (zh) * 2016-03-11 2017-09-19 华为技术有限公司 一种协同流的识别方法、系统以及使用该方法的服务器

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103250376A (zh) * 2010-12-15 2013-08-14 国际商业机器公司 用于执行与通信网络的节点有关的预测分析的方法和系统
US8560511B1 (en) * 2011-07-20 2013-10-15 Google Inc. Fine-grain locking
CN103297433A (zh) * 2013-05-29 2013-09-11 中国科学院计算技术研究所 基于网络数据流的http僵尸网络检测方法及系统
CN107181724A (zh) * 2016-03-11 2017-09-19 华为技术有限公司 一种协同流的识别方法、系统以及使用该方法的服务器
CN106982209A (zh) * 2017-03-22 2017-07-25 北京匡恩网络科技有限责任公司 工业控制网络接入设备识别方法、装置、以及系统

Also Published As

Publication number Publication date
CN108429802A (zh) 2018-08-21

Similar Documents

Publication Publication Date Title
CN108429802B (zh) 物联网设备信息获取方法及装置
CN107948172B (zh) 一种基于人工智能行为分析的车联网入侵攻击检测方法和系统
CN101075911B (zh) 统计信息收集系统及统计信息收集装置
US8090820B2 (en) Distributed traffic analysis
ES2468793T3 (es) Clasificación de tráfico
CN100544473C (zh) 用于确定运行无线网络中移动终端性能的方法
EP2001190B1 (en) Measuring method for network performance and system thereof
US20130191890A1 (en) Method and system for user identity recognition based on specific information
CN107426059B (zh) Dpi设备特征库自动更新方法、系统、dpi设备及云端服务器
CN111953552B (zh) 数据流的分类方法和报文转发设备
CN104486161A (zh) 一种网络流量的识别方法及装置
KR100495086B1 (ko) 수동적 측정 방식을 이용한 인터넷 프로토콜 네트워크트래픽 정보 분석 장치 및 방법
CN104994016A (zh) 用于分组分类的方法和装置
CN106535240A (zh) 基于云平台的移动app集中性能分析方法
US20150195155A1 (en) Method and apparatus for detecting application
CN110868436A (zh) 物联网数据采集方法和装置
CN105657001B (zh) 一种分析通信大数据的方法及装置
CN106257867A (zh) 一种加密流量的业务识别方法和装置
CN116458196A (zh) 基于分析的业务分类规则
TWI580288B (zh) Action online quality analysis system and method
CN105871573A (zh) 一种报文分析过滤方法及装置
CN111614611B (zh) 一种用于电网嵌入式终端的网络安全审计方法及装置
Pekar et al. Towards threshold‐agnostic heavy‐hitter classification
CN111917715B (zh) 一种基于802.11ac MAC层指纹的设备识别方法
CN109905325A (zh) 一种流量引导方法及流量识别设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant