CN110868436A - 物联网数据采集方法和装置 - Google Patents

物联网数据采集方法和装置 Download PDF

Info

Publication number
CN110868436A
CN110868436A CN201810989620.0A CN201810989620A CN110868436A CN 110868436 A CN110868436 A CN 110868436A CN 201810989620 A CN201810989620 A CN 201810989620A CN 110868436 A CN110868436 A CN 110868436A
Authority
CN
China
Prior art keywords
target
data
identifier
equipment
internet
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201810989620.0A
Other languages
English (en)
Other versions
CN110868436B (zh
Inventor
李勇
吴婧
蒙明远
金德鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tsinghua University
Original Assignee
Tsinghua University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tsinghua University filed Critical Tsinghua University
Priority to CN201810989620.0A priority Critical patent/CN110868436B/zh
Publication of CN110868436A publication Critical patent/CN110868436A/zh
Application granted granted Critical
Publication of CN110868436B publication Critical patent/CN110868436B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks

Landscapes

  • Engineering & Computer Science (AREA)
  • Health & Medical Sciences (AREA)
  • Computing Systems (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Computer Networks & Wireless Communication (AREA)
  • Signal Processing (AREA)
  • Data Exchanges In Wide-Area Networks (AREA)

Abstract

本发明实施例提供物联网数据采集方法和装置。其中,方法包括:获取目标信令流,根据目标信令流获取目标IP地址,并根据目标IP地址采集目标数据流;根据IP地址和隧道端点标识对目标信令流和目标数据流进行匹配,确定目标数据流中数据对应的设备标识,获取携带设备标识的物联网数据。本发明实施例提供的物联网数据采集方法和装置,能确定数据来自于哪个设备,实现将数据流与设备进行关联,为数据驱动的物联网流量行为分析提供高可用性和可靠性的数据集。

Description

物联网数据采集方法和装置
技术领域
本发明实施例涉及物联网技术领域,尤其涉及物联网数据采集方法和装置。
背景技术
物联网(Internet of things,IOT)是一种互联网、传统电信网的信息承载体,它能将万物与互联网、传统通信网络紧密联系在一起,让所有行使独立功能的普通物体实现互连互通。目前,物联网在各个行业,例如交通运输业、制造业、医疗行业等,有着广泛的应用,与此同时,它也正逐渐渗透到个人生活场景中,例如智能家居、POS机、报警监控设备等。据统计,物联网设备是近几年增长最快的移动终端设备,预计2016年到2020年,物联网设备的平均年增长率将达到34%。这些设备可以通过运营商提供的蜂窝网络服务接入移动网络,也可以通过无线局域网接入到宽带固网,从而实现信息的传输与交换。而物联网设备数目的急剧增长必然为传统的移动网络负载带来巨大压力。此外,物联网设备存在严重的安全问题,这是由于IOT设备大多运行与Linux的操作系统之上,攻击者可以利用Linux的已知漏洞,轻易对其实施攻击。结合物联网设施应用场景及使用协议多样的特点,可以预见未来IOT设备数量的不断增长,将给移动网络性能优化以及物联网安全问题的监控与预案带来极大的挑战。
现有的物联网领域研究工作大多集中于对物联网网络架构、协议以及服务标准(QoS)提升、安全以及隐私问题的研究与设计。而针对物联网云平台的流量安全分析系统采用的仍旧是传统网络安全防护手段,即模拟攻击者的手段对平台安全防护措施进行检测,如开放端口扫描,漏洞检测等。这种主动的监测方式虽然目的性更强,但存在覆盖范围不足的缺陷。随着大数据时代的到来,基于数据分析探测潜在网络安全风险的手段开始应用在网络安全领域。鉴于此,有必要采集与分析物联网数据,在充分理解物联网设备流量行为的基础上,开发出相应的技术手段用于定位物联网中潜在的安全风险。此外,理解物联网设备在网络中的流量行为,也有助于运营商对传统网络架构与机制的改进与优化,从而提升物联网服务质量,促进万物互联时代的来临。
在分析物联网设备行为时,获取设备的类型信息至关重要。这是因为不同类型IOT设备因为应用场景的不同,其流量行为特征也千差万别。在设计网络优化及安全防范方案时,有必要根据不同类型的设备的行为特征和具体使用场景设计个性化的策略。因此,需要基于带有设备标识以及类型信息的物联网数据流,对设备进行分析。
然而,现有的运营商物联网数据采集系统,只能分开采集设备的信令流和数据流。这给分析物联网设备行为带来很大的困难,首先,单从数据流中无法得到设备标识信息,无法判断某个数据流来自于哪个设备;其次,信令流中虽然有设备标识信息,但对设备类型的描述过于模糊,无法给出设备具有实际应用价值的类型信息。
发明内容
针对现有技术存在的难以确定数据来自于哪个设备的问题,本发明实施例提供物联网数据采集方法和装置。
根据本发明的第一方面,本发明实施例提供一种物联网数据采集方法,包括:
获取目标信令流,根据所述目标信令流获取目标IP地址,并根据所述目标IP地址采集目标数据流;
根据IP地址和隧道端点标识对所述目标信令流和所述目标数据流进行匹配,确定所述目标数据流中数据对应的设备标识,获取携带设备标识的物联网数据。
根据本发明的第二方面,本发明实施例提供一种物联网数据采集装置,包括:
数据采集模块,用于获取目标信令流,根据所述目标信令流获取目标IP地址,并根据所述目标IP地址采集目标数据流;
设备匹配模块,用于根据IP地址和隧道端点标识对所述目标信令流和所述目标数据流进行匹配,获取携带设备标识的物联网数据。
根据本发明的第三方面,本发明实施例提供一种电子设备,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行本发明实施例的物联网数据采集方法及其所有可选实施例的方法。
根据本发明的第四方面,本发明实施例提供一种非暂态计算机可读存储介质,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行本发明实施例的物联网数据采集方法及其所有可选实施例的方法。
本发明实施例提供的物联网数据采集方法和装置,通过利用设备的信令信息,对IP地址和隧道端点标识对目标信令流和目标数据流进行匹配,确定目标数据流中数据对应的设备标识,获取携带设备标识的物联网数据,能确定数据来自于哪个设备,实现将数据流与设备进行关联,为数据驱动的物联网流量行为分析提供高可用性和可靠性的数据集。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例物联网数据采集方法的流程图;
图2为本发明实施例物联网数据采集方法中获取目标数据流的方法的流程图;
图3为本发明实施例物联网数据采集方法中获得携带设备标识和设备类型标识的物联网数据的方法的流程图;
图4为本发明实施例物联网数据采集方法中获得设备型号核准号码与设备类型标识之间的对应关系的方法的流程图;
图5为本发明实施例物联网数据采集方法中维护目标IP地址池的方法的流程图;
图6为本发明实施例物联网数据采集方法中对目标信令流和目标数据流进行匹配的方法的流程图;
图7为本发明实施例物联网数据采集装置的功能框图;
图8为本发明实施例物联网数据采集装置的工作流程框架示意图;
图9为本发明实施例电子设备的结构框图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
为了克服现有技术的上述问题,本发明实施例提供一种物联网数据采集方法,其发明构思是,在分析物联网设备的信令特征的基础上,提取具有明确类型标识设备的信令流以及对应的数据流,并采用合理的方法对设备信令流与数据流进行匹配,给数据流加上信令信息,最终采集到带有设备标识与类型标识的数据流,为物联网设备流量分析提供具有可用性及可靠性的数据集。
图1为本发明实施例物联网数据采集方法的流程图。如图1所示,一种物联网数据采集方法包括:步骤S101、获取目标信令流,根据目标信令流获取目标IP地址,并根据目标IP地址采集目标数据流。
需要说明的是,采集数据流并不困难,一般情况下,只要知道需要采集的数据的源IP地址即可以采集到该IP地址收发的数据。因此,采集目标数据流之前,需要确定哪些IP地址是需要去采集数据的IP地址,即确定目标IP地址。
数据流为物联网设备与对端设备之间交换的数据包,为pcap格式的数据。
一对设备之间一次交换的数据包,为数据流中的一个数据包。
信令流是在设备通信开始、结束和更新过程中建立的。信令的主要字段如表1所示。
表1信令格式表
字段 含义
IMEI 国际移动设备识别码
IMSI 国际移动用户识别码
MSISDN 移动台国际用户识别码
TAC 设备型号核准号码,IMEI前八位,代表机型
APN 接入点名称
UserIP 设备内网ip
Loc 基站地址信息
TimeStamp 时间戳
GGSNIP 网关GPRS支持节点IP
SGSNIP 服务GPRS支持节点IP
usTEID/dsTEID 上/下行隧道端点标识
Type 信令类型标识符(10:建立,11:维持,12:关闭)
隧道端点标识(Tunnel Endpoint Identifier,简称TEID),是终端与核心网之间的隧道,用于标识隧道的两端,区分隧道的唯一性。隧道端点标识,也称为隧道识别码。
IMEI(International Mobile Equipment Identity,国际移动设备识别码)由15位数字组成,是移动设备全球的唯一识别号码,相当于移动设备的身份证号码。物联网设备均为移动设备。IMEI,也称为移动设备识别码或设备标识。
TAC(Type Approval Code,设备型号核准号码)由欧洲型号认证中心分配。TAC为IMEI的前八位数字。TAC,也称为设备型号识别码,或设备型号标识。
IMSI(International Mobile Subscriber Identification Number,国际移动用户识别码),是区别移动用户的标志,储存在SIM卡中,可用于区别移动用户的有效信息。IMSI,也称为移动用户识别码或用户标识。
由于信令中携带了每一个设备的IP地址、移动设备识别码、通道的建立及关闭等动态信息,可以根据信令流获取目标IP地址。
现有物联网数据采集接口可以分别采集设备包交换过程中的信令数据和数据包数据,得到信令流和数据流,且两者独立采集。
可以直接将采集的信令流作为目标信令流,也可以根据预设的条件对采集的信令流进行筛选,获得目标信令流。
例如,当仅需要采集来自某一地点的数据时,则可以通过信令中的“Loc”字段对信令流进行筛选,从信令流中筛选出来自目标地点的信令作为目标信令流。
获得目标信令流后,根据目标信令流中各信令携带的IP地址,即UserIP字段,获取IP地址作为目标IP地址。
目标IP地址可以放入一个可以动态变化的目标IP地址池,然后对池内的IP地址进行数据采集。因为信令中包含了每一个设备的IP地址、移动设备标识符、隧道的建立及关闭等动态信息,可以根据信令的动态变化来维护一个同样动态变化的目标IP地址池,然后再根据目标IP地址池中的IP地址去采集数据。
由于硬件处理能力的限制,仅能在同一时刻对有限数量的IP地址去采集数据,因此,建立一个可以动态变化的IP池至关重要。目标IP地址池中存放的是需要对其采集数据的目标IP地址,其容量上限是物联网数据采集装置在同一时刻可以并行采集数据的IP地址的数量。因为网络环境是在实时变化的,同一个IP地址很可能也只是在有限的时间段内才会收发数据,故而目标IP地址池也是需要实时更新和维护的,需要及时去除失效的IP地址并放入目前采集到数据的可能性高的IP地址。
获取目标IP地址后,对目标IP地址进行数据采集,获得目标数据流。
图2为本发明实施例物联网数据采集方法中获取目标数据流的方法的流程图。如图2所示,获取目标数据流的步骤包括:根据预设的筛选条件对采集的信令流进行筛选,获得目标信令流;根据目标信令流获取目标IP地址;根据目标IP地址采集目标数据流,即相当于根据目标IP地址对采集的数据流进行筛选,仅获取目标IP地址收发的数据作为目标数据流。
步骤S102、根据IP地址和隧道端点标识对目标信令流和目标数据流进行匹配,确定目标数据流中数据对应的设备标识,获取携带设备标识的物联网数据。
虽然在数据采集的过程当中是根据信令所提供的信息去采集数据,但采集信令与采集数据的部分是分开进行的,两者之间并不存在显性的对应关系。为了方便后续步骤中得到具有设备标识的数据,需要将所获取的目标信令流与目标数据流进行匹配,寻找到二者之间的对应关系。
需要说明的是,获取目标数据流时,是对目标IP地址进行数据采集,并利用了隧道,因此,可以确定每一数据包的IP地址和隧道端点标识。
目标信令流中各信令携带了设备的IP地址和隧道端点标识和IMEI。因此,可以根据IP地址和隧道端点标识对目标信令流和目标数据流进行匹配,确定目标数据流中每一数据包对应的信令,即确定数据包的信令标识,可以获得携带信令标识的物联网数据,从而根据数据包的信令标识携带的IMEI,确定每一数据包对应的IMEI,确定目标数据流中数据对应的设备标识。
匹配的条件为数据是从信令所表示的隧道中进行传输的且数据传输的时间位于该隧道开启的时间段内。符合上述匹配的条件的数据包和信令是互相对应的。
确定目标数据流中数据对应的设备标识后,即可获得携带设备标识的物联网数据。
当数据流的数据格式为pcap数据时,携带设备标识的物联网数据的数据格式为(国际移动设备识别码,pcap数据)。即增加国际移动设备识别码字段,该字段用于表示pcap数据对应的IMEI。
需要说明的是,由于目标数据流中每一数据包的传输时间(开始时间、结束时间和持续时长)是确定的,还可以在携带设备标识的物联网数据中加入时间信息,从而获得数据格式为(时间,国际移动设备识别码,pcap数据)。即增加时间字段,该字段用于表示pcap数据的传输时间。
本发明实施例通过利用设备的信令信息,对IP地址和隧道端点标识对目标信令流和目标数据流进行匹配,确定目标数据流中数据对应的设备标识,获取携带设备标识的物联网数据,能确定数据来自于哪个设备,实现将数据流与设备进行关联,为数据驱动的物联网流量行为分析提供高可用性和可靠性的数据集。
基于上述实施例的内容,获取携带设备标识的物联网数据之后还包括:根据预先获得的设备型号核准号码与设备类型标识之间的对应关系,获取携带设备标识的物联网数据携带的设备标识对应的设备类型标识,获得携带设备标识和设备类型标识的物联网数据。
需要说明的是,在物联网中,某一类设备的流量行为具有一定的共性,需要对一类设备进行行为分析。
优选地,获取携带设备标识的物联网数据之后,IMEI的前8位为TAC,信令中携带了TAC,根据预先获得的设备型号核准号码TAC与设备类型标识之间的对应关系,确定携带设备标识的物联网数据携带的每一设备标识所对应的设备类型标识,从而获得携带设备标识和设备类型标识的物联网数据。
预先获得的设备型号核准号码TAC与设备类型标识之间的对应关系,可以存储于具有设备类型标识的TAC数据库中。
图3为本发明实施例物联网数据采集方法中获得携带设备标识和设备类型标识的物联网数据的方法的流程图。如图3所示,获得携带设备标识和设备类型标识的物联网数据的步骤包括:根据携带信令标识的物联网数据,获取携带设备标识的物联网数据;根据携带的设备标识,查询具有设备类型标识的TAC数据库,获得设备标识对应的设备类型标识,获得携带设备标识和设备类型标识的物联网数据。
因为前面对目标信令流与目标数据流进行了匹配,已经可以得到了具有信令标识的数据流。此时,则可以通过从信令中提取IMEI,并以IMEI作为数据的标识。然后,因为IMEI的前八位即是TAC,故而可以将具有IMEI标识的数据流与前面得到的具有类别标识的TAC数据库中的TAC进行比对,可以得到数据流的类别标识。
获得设备标识对应的设备类型标识后,即可获得同时携带设备标识和设备类型标识的物联网数据。
携带设备标识的物联网数据的数据格式为(国际移动设备识别码,pcap数据)或(时间,国际移动设备识别码,pcap数据)时,相应地,携带设备标识和设备类型标识的物联网数据的数据格式为(国际移动设备识别码,设备类型标识,pcap数据)或(时间,国际移动设备识别码,设备类型标识,pcap数据)。
本发明实施例通过设备型号核准号码与设备类型标识之间的对应关系,获取携带设备标识的物联网数据携带的设备标识对应的设备类型标识,获得携带设备标识和设备类型标识的物联网数据,能确定数据来自于哪种类型的设备,实现将数据流与设备类型进行关联,进一步为数据驱动的物联网流量行为分析提供高可用性和可靠性的数据集。
基于上述实施例的内容,获得设备型号核准号码与设备类型标识之间的对应关系的具体步骤包括:根据预设的标签字段,对设备型号核准号码进行标记,获得设备型号核准号码对应的标签编码;根据标签编码,确定设备类型标识,以及每一设备类型标识对应的设备型号核准号码,获得设备型号核准号码与设备类型标识之间的对应关系。
具体地,设备型号核准号码与设备类型标识之间的对应关系可以通过以下步骤获取。
首先,获得设备型号核准号码的集合,即获得TAC集。
可以从历史物联网数据的信令流中提取出各设备型号标识码,构成TAC集,也可以根据厂商或第三方机构的采集的数据获得TAC集。本发明实施例对此不作具体限制。
可以理解的是,为了能够对TAC集中的TAC进行标签标记,必须确定出需要进行标记的标签字段的集合。通过文献调研、互联网检索以及参考设备生产厂商的产品分类方法与相关TAC数据后,根据获得的信息来扩充与修改标签字段,并通过对TAC进行标记过程中的信息反馈对标签字段中的无效项、冗余项进行筛选与删除,从而确定预设的标签字段。需要注意的是,对于不同硬件类型的TAC,预设的标签字段是不同的。
表2示出了预设的标签字段的一个例子。
表2预设的标签字段表
Figure BDA0001780493800000111
获得设备型号核准号码的集合后,根据预设的标签字段,对设备型号核准号码的集合中的每一设备型号核准号码进行标记,获得设备型号核准号码对应的标签编码。
对于每一预设的标签字段,若该TAC具有该字段的特性即标记为1,否则为0。
进行标记所根据的信息来源至少包括:设备生产厂商和第三方机构公开的TAC数据,设备生产厂商对设备的描述、官方文档与用户手册,通过搜索引擎收集设备供应商、客户、物联网方案供应商等对该设备的描述。
获得设备型号核准号码对应的标签编码后,根据标签编码的相似性进行聚类,将具有相似标签特性的TAC划分为同一类,确定设备类型标识。
确定设备类型标识时,根据设备类型所包括的TAC的主要特征对该类型进行命名。在对各个类型进行命名时,优先观察该类中的TAC是否具有相同的应用领域(healthcare、vehicle、POS等),若有,则按照其应用领域对该类进行命名。若该类中的TAC属于多个应用领域,则考虑按照其共同具有的主要功能(metering、locating、computing等)进行命名。若其仍可能含有多个主要功能,则按照其硬件类型(modem、handhold、industrial terminal等)对其进行命名。
表3示出了设备类型标识的一个例子。
表3设备类型标识表
Figure BDA0001780493800000131
根据设备类型标识以及每一设备类型标识对应的设备型号核准号码,生成设备型号核准号码与设备类型标识之间的对应关系。
确定设备型号核准号码与设备类型标识之间的对应关系后,可以建立具有设备类型标识的TAC数据库。数据库中每一项的数据格式为:(TAC,设备类型标识,设备名称,设备生产厂商)。
图4为本发明实施例物联网数据采集方法中获得设备型号核准号码与设备类型标识之间的对应关系的方法的流程图。如图4所示,获得设备型号核准号码与设备类型标识之间的对应关系的步骤包括:根据预设的标签字段,对信令中所有可能出现的设备型号核准号码进行标记,获得设备型号核准号码对应的标签编码;根据标签编码的相似性进行聚类,生成设备型号核准号码与设备类型标识之间的对应关系,生成具有设备类型标识的TAC数据库。
其中,信令中所有可能出现的设备型号核准号码,可以为已生产的各种设备的设备型号核准号码。
基于上述实施例的内容,根据目标信令流获取目标IP地址的具体步骤包括:对于目标信令流中每一新到达的信令,根据该信令的类型,维护目标IP地址池,将维护后的目标IP地址池中的IP地址作为目标IP地址。
具体地,对于目标信令流中每一新到达的信令,获取该信令的类型,根据该信令的类型,维护目标IP地址池。
信令携带了信令类型,即Type字段。根据信令中的Type字段,可以获取信令的类型。
根据该信令的类型,维护目标IP地址池的具体步骤包括:
若“Type”字段等于10(表示建立信道)或11(表示维持信道),则考虑将信令中的“UserIP”加入到目标IP地址池中;反之,若“Type”字段等于12(表示关闭信道)且信令中的“UserIP”已在目标IP地址池中时,则会将其从目标IP地址池中移除。
可以理解的是,还需要维护一个表示信令中“UserIP”与“IMEI”的对应关系的表格(IP-IMEI对应关系表格)。正常情况下,IP和IMEI应该是一一对应的,表示一个设备在某一段时间内仅占用一个IP地址。因此,当新到达的信令中的IP地址与IMEI的对应关系与当前存在的IP-IMEI对应关系表格中的关系不同时,则表明该设备占用了新的IP地址或是该IP地址被新的设备所占用了,此时也需要动态的更新IP-IMEI对应关系表格的内容和目标IP地址池;若是某设备占用了新的IP地址,则需要修改IP-IMEI对应关系表格,然后将旧的IP地址从目标IP地址池中移除并放入新的IP地址;若某IP地址被新的设备所占用了,则仅需要修改IP-IMEI对应关系表格,但不需要更新目标IP地址池。IP地址与IMEI的对应关系可表示为(IP,IMEI)。
图5为本发明实施例物联网数据采集方法中维护目标IP地址池的方法的流程图。维护目标IP地址池的方法的步骤包括:判断是否有新信令到达;当有信令达到时,判断该信令的“Type”字段;若“Type”字段等于12,判断该信令中的“UserIP”是否已在目标IP地址池中,若是,则将其从目标IP地址池中移除,并从IP-IMEI对应关系表格中删除与该“UserIP”有关的项;若“Type”字段等于10或11,判断(IP,IMEI)对应关系中是否存在与该信令的IMEI有关的项,若否,则判断(IP,IMEI)对应关系中是否存在与信令的“UserIP”有关的项;若否,则判断目标IP地址池是否已满,若未满,则向目标IP地址池(简称“IP池”)中添加该“UserIP”,并在IP-IMEI对应关系表格中添加该信令中的IP-IMEI对应关系。
基于上述实施例的内容,根据IP地址和隧道端点标识对目标信令流和目标数据流进行匹配,确定目标数据流中数据对应的设备标识的具体步骤包括:对于目标数据流中的每一数据包,提取该数据包的IP地址与隧道端点标识对,以及该数据包的时间戳;提取目标信令流中的IP地址与隧道端点标识对,以及每一IP地址与隧道端点标识对中的隧道端点标识对应的时间窗口;对于目标数据流中的每一数据包,若判断获知该数据包的IP地址与隧道端点标识对与目标信令流中的任一IP地址与隧道端点标识对相同,且该数据包的时间戳处于该IP地址与隧道端点标识对中的隧道端点标识对应的时间窗口内,则获取目标信令流中的该IP地址与隧道端点标识对对应的信令携带的设备标识,作为该数据包对应的设备标识。
图6为本发明实施例物联网数据采集方法中对目标信令流和目标数据流进行匹配的方法的流程图。图6示出了对目标信令流和目标数据流进行匹配的步骤。
将数据与信令进行匹配的关键在于信令和数据的IP-TEID必须相等,表示数据确实是从信令所对应的隧道中进行传输的。
对于目标数据流中的每一数据包,提取该数据包的IP地址与隧道端点标识对(IP,TEID),以及该数据包的时间戳。IP地址与隧道端点标识对,还可表示为IP-TEID。
数据包的时间戳,用于表示数据包传输的时间。
对于目标信令流,提取目标信令流中的IP地址与隧道端点标识对(IP,TEID),以及每一(IP,TEID)中TEID对应的时间窗口。
由于信令携带了时间戳信息,Type为“10”的信令表示隧道的开始,Type为“12”的信令则表示隧道的结束,利用首尾信令的时间戳可以得到隧道持续的时间窗口,即TEID对应的时间窗口。因此,根据信令中的时间戳信息可以建立TEID对应的时间窗口,以表示隧道的持续时间。
进行匹配时,若数据包的IP-TEID和目标信令流中的任一IP-TEID相等,则还需要判断该数据包的时间戳是否位于目标信令流中的该IP-TEID中的TEID对应的时间窗口内。
数据包的IP-TEID和目标信令流中的任一IP-TEID相等,说明数据确实是从信令所对应的隧道中进行传输的,即数据和信令在IP地址和隧道是匹配的,还需要确定数据确实是从信令所对应的隧道的开启时间窗口内进行传输的。因此,若该数据包的时间戳位于目标信令流中的该IP-TEID中的TEID对应的时间窗口内,说明数据确实是从信令所对应的隧道的开启时间窗口内进行传输的,也就是说,信令和数据除了在IP地址和隧道是匹配的以外,在时间上也是匹配的;反之,则说明数据虽然是从该信令所对应的隧道中进行传输的,但不是从该信令对应的隧道的开启时间窗口内进行传输的,也就是说,信令和数据虽然在IP地址和隧道是匹配的,但在时间上是不匹配的。
根据IP-TEID与时间窗两个条件进行匹配,可以确保数据和信令是正确对应的,从而获得携带信令标识的数据流。
基于上述实施例的内容,提取目标信令流中的IP地址与隧道端点标识对,以及每一IP地址与隧道端点标识对中的隧道端点标识对应的时间窗口之前还包括:去除目标信令流中的无效信令;其中,无效信令为国际移动设备标识码与国际移动用户识别码非唯一对应的信令。
优选地,提取目标信令流中的IP地址与隧道端点标识对,以及每一IP地址与隧道端点标识对中隧道端点标识对应的时间窗口之前,去除目标信令流中的无效信令,仅保留有效信令。
无效信令为国际移动设备标识码与国际移动用户识别码非唯一对应的信令。
有效信令为国际移动设备标识码与国际移动用户识别码唯一对应的信令。
图7为本发明实施例物联网数据采集装置的功能框图。基于上述实施例的内容,如图7所示,一种物联网数据采集装置包括:数据采集模块701,用于数据采集模块,用于获取目标信令流,根据目标信令流获取目标IP地址,并根据目标IP地址采集目标数据流;设备匹配模块702,用于根据IP地址和隧道端点标识对目标信令流和目标数据流进行匹配,获取携带设备标识的物联网数据。
本发明实施例提供的物联网数据采集的装置,用于执行本发明实施例提供的物联网数据采集方法,物联网数据采集装置包括的各模块实现相应功能的具体方法和流程详见上述物联网数据采集方法的实施例,此处不再赘述。
本发明实施例通过利用设备的信令信息,对IP地址和隧道端点标识对目标信令流和目标数据流进行匹配,确定目标数据流中数据对应的设备标识,获取携带设备标识的物联网数据,能确定数据来自于哪个设备,实现将数据流与设备进行关联,为数据驱动的物联网流量行为分析提供高可用性和可靠性的数据集。
基于上述实施例的内容,如图7所示,物联网数据采集装置还包括:设备分类模块703,用于获得设备型号核准号码与设备类型标识之间的对应关系;类型匹配模块704,用于根据预先获得的设备型号核准号码与设备类型标识之间的对应关系,获取携带设备标识的物联网数据携带的设备标识对应的设备类型标识,获得携带设备标识和设备类型标识的物联网数据。
本发明实施例提供的物联网数据采集的装置,用于执行本发明实施例提供的物联网数据采集方法,物联网数据采集装置包括的各模块实现相应功能的具体方法和流程详见上述物联网数据采集方法的实施例,此处不再赘述。
本发明实施例通过设备型号核准号码与设备类型标识之间的对应关系,获取携带设备标识的物联网数据携带的设备标识对应的设备类型标识,获得携带设备标识和设备类型标识的物联网数据,能确定数据来自于哪种类型的设备,实现将数据流与设备类型进行关联,进一步为数据驱动的物联网流量行为分析提供高可用性和可靠性的数据集。
图8为本发明实施例物联网数据采集装置的工作流程框架示意图。如图8所示,虚线框801、802、803、804表示的流程分别由设备分类模块、数据采集模块、设备匹配模块和类型匹配模块完成。设备分类模块、数据采集模块、设备匹配模块和类型匹配模块实现虚线框801、802、803、804表示的流程的具体步骤详见上述各实施例,此处不再赘述。
图9为本发明实施例电子设备的结构框图。基于上述实施例的内容,如图9所示,一种电子设备包括:处理器(processor)901、存储器(memory)902和总线903;其中,处理器901和存储器902通过总线903完成相互间的通信;处理器901用于调用存储器902中的程序指令,以执行上述各方法实施例所提供的方法,例如包括:物联网数据采集方法;获取目标数据流的方法;获得携带设备标识和设备类型标识的物联网数据的方法;获得设备型号核准号码与设备类型标识之间的对应关系的方法;维护目标IP地址池的方法;对目标信令流和目标数据流进行匹配的方法;获取携带设备标识的物联网数据的方法;根据目标信令流获取目标IP地址的方法;去除目标信令流中的无效信令的方法等。
本发明另一实施例公开一种计算机程序产品,计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,计算机程序包括程序指令,当程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的方法,例如包括:物联网数据采集方法;获取目标数据流的方法;获得携带设备标识和设备类型标识的物联网数据的方法;获得设备型号核准号码与设备类型标识之间的对应关系的方法;维护目标IP地址池的方法;对目标信令流和目标数据流进行匹配的方法;获取携带设备标识的物联网数据的方法;根据目标信令流获取目标IP地址的方法;去除目标信令流中的无效信令的方法等。
本发明另一实施例提供一种非暂态计算机可读存储介质,非暂态计算机可读存储介质存储计算机指令,计算机指令使计算机执行上述各方法实施例所提供的方法,例如包括:物联网数据采集方法;获取目标数据流的方法;获得携带设备标识和设备类型标识的物联网数据的方法;获得设备型号核准号码与设备类型标识之间的对应关系的方法;维护目标IP地址池的方法;对目标信令流和目标数据流进行匹配的方法;获取携带设备标识的物联网数据的方法;根据目标信令流获取目标IP地址的方法;去除目标信令流中的无效信令的方法等。
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行上述各个实施例或者实施例的某些部分的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种物联网数据采集方法,其特征在于,包括:
获取目标信令流,根据所述目标信令流获取目标IP地址,并根据所述目标IP地址采集目标数据流;
根据IP地址和隧道端点标识对所述目标信令流和所述目标数据流进行匹配,确定所述目标数据流中数据对应的设备标识,获取携带设备标识的物联网数据。
2.根据权利要求1所述的物联网数据采集方法,其特征在于,获取携带设备标识的物联网数据之后还包括:
根据预先获得的设备型号核准号码与设备类型标识之间的对应关系,获取所述携带设备标识的物联网数据携带的设备标识对应的设备类型标识,获得携带设备标识和设备类型标识的物联网数据。
3.根据权利要求2所述的物联网数据采集方法,其特征在于,获得设备型号核准号码与设备类型标识之间的对应关系的具体步骤包括:
根据预设的标签字段,对设备型号核准号码进行标记,获得设备型号核准号码对应的标签编码;
根据所述标签编码,确定设备类型标识,以及每一设备类型标识对应的设备型号核准号码,获得设备型号核准号码与设备类型标识之间的对应关系。
4.根据权利要求1所述的物联网数据采集方法,其特征在于,根据所述目标信令流获取目标IP地址的具体步骤包括:
对于目标信令流中每一新到达的信令,根据该信令的类型,维护目标IP地址池,将维护后的目标IP地址池中的IP地址作为目标IP地址。
5.根据权利要求1至4任一所述的物联网数据采集方法,其特征在于,根据IP地址和隧道端点标识对所述目标信令流和所述目标数据流进行匹配,确定所述目标数据流中数据对应的设备标识的具体步骤包括:
对于所述目标数据流中的每一数据包,提取该数据包的IP地址与隧道端点标识对,以及该数据包的时间戳;
提取所述目标信令流中的IP地址与隧道端点标识对,以及每一IP地址与隧道端点标识对中的隧道端点标识对应的时间窗口;
对于所述目标数据流中的每一数据包,若判断获知该数据包的IP地址与隧道端点标识对与目标信令流中的任一IP地址与隧道端点标识对相同,且该数据包的时间戳处于该IP地址与隧道端点标识对中的隧道端点标识对应的时间窗口内,则获取目标信令流中的该IP地址与隧道端点标识对对应的信令携带的设备标识,作为该数据包对应的设备标识。
6.根据权利要求5所述的物联网数据采集方法,其特征在于,提取所述目标信令流中的IP地址与隧道端点标识对,以及每一IP地址与隧道端点标识对中的隧道端点标识对应的时间窗口之前还包括:
去除所述目标信令流中的无效信令;
其中,所述无效信令为国际移动设备标识码与国际移动用户识别码非唯一对应的信令。
7.一种物联网数据采集装置,其特征在于,包括:
数据采集模块,用于获取目标信令流,根据所述目标信令流获取目标IP地址,并根据所述目标IP地址采集目标数据流;
设备匹配模块,用于根据IP地址和隧道端点标识对所述目标信令流和所述目标数据流进行匹配,获取携带设备标识的物联网数据。
8.根据权利要求7所述的物联网数据采集装置,其特征在于,还包括:
设备分类模块,用于获得设备型号核准号码与设备类型标识之间的对应关系;
类型匹配模块,用于根据预先获得的设备型号核准号码与设备类型标识之间的对应关系,获取所述携带设备标识的物联网数据携带的设备标识对应的设备类型标识,获得携带设备标识和设备类型标识的物联网数据。
9.一种电子设备,其特征在于,包括:
至少一个处理器;以及
与所述处理器通信连接的至少一个存储器,其中:
所述存储器存储有可被所述处理器执行的程序指令,所述处理器调用所述程序指令能够执行如权利要求1至6任一所述的方法。
10.一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,所述计算机指令使所述计算机执行如权利要求1至6任一所述的方法。
CN201810989620.0A 2018-08-28 2018-08-28 物联网数据采集方法和装置 Active CN110868436B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810989620.0A CN110868436B (zh) 2018-08-28 2018-08-28 物联网数据采集方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810989620.0A CN110868436B (zh) 2018-08-28 2018-08-28 物联网数据采集方法和装置

Publications (2)

Publication Number Publication Date
CN110868436A true CN110868436A (zh) 2020-03-06
CN110868436B CN110868436B (zh) 2021-03-23

Family

ID=69651906

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810989620.0A Active CN110868436B (zh) 2018-08-28 2018-08-28 物联网数据采集方法和装置

Country Status (1)

Country Link
CN (1) CN110868436B (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354124A (zh) * 2020-03-11 2020-06-30 北京创联云睿科技有限公司 一种智能物联网售货系统及服务设备、售货机
CN113810310A (zh) * 2021-09-10 2021-12-17 北京云杉世纪网络科技有限公司 一种流量采集方法、装置、设备及存储介质
CN114339689A (zh) * 2021-12-30 2022-04-12 天翼物联科技有限公司 一种物联网机卡绑定池管控方法、装置及相关介质
CN114422619A (zh) * 2020-10-12 2022-04-29 中国移动通信集团广东有限公司 业务识别方法、装置、设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120082073A1 (en) * 2010-10-05 2012-04-05 Cisco Technology, Inc. System and method for offloading data in a communication system
CN102595467A (zh) * 2011-01-04 2012-07-18 中国移动通信集团公司 一种数据采集方法和设备
US20130191890A1 (en) * 2012-01-21 2013-07-25 Broaddeep (Beijing) Network Technology Co., Ltd Method and system for user identity recognition based on specific information
CN104702564A (zh) * 2013-12-05 2015-06-10 华为技术有限公司 一种网络共享用户识别方法及装置
CN106936652A (zh) * 2015-12-29 2017-07-07 北京喜乐航科技股份有限公司 多终端设备的数据传输方法、装置及系统
CN107483854A (zh) * 2017-08-30 2017-12-15 深圳创维-Rgb电子有限公司 一种多屏显示方法及多屏电视机

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120082073A1 (en) * 2010-10-05 2012-04-05 Cisco Technology, Inc. System and method for offloading data in a communication system
CN102595467A (zh) * 2011-01-04 2012-07-18 中国移动通信集团公司 一种数据采集方法和设备
US20130191890A1 (en) * 2012-01-21 2013-07-25 Broaddeep (Beijing) Network Technology Co., Ltd Method and system for user identity recognition based on specific information
CN104702564A (zh) * 2013-12-05 2015-06-10 华为技术有限公司 一种网络共享用户识别方法及装置
CN106936652A (zh) * 2015-12-29 2017-07-07 北京喜乐航科技股份有限公司 多终端设备的数据传输方法、装置及系统
CN107483854A (zh) * 2017-08-30 2017-12-15 深圳创维-Rgb电子有限公司 一种多屏显示方法及多屏电视机

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111354124A (zh) * 2020-03-11 2020-06-30 北京创联云睿科技有限公司 一种智能物联网售货系统及服务设备、售货机
CN114422619A (zh) * 2020-10-12 2022-04-29 中国移动通信集团广东有限公司 业务识别方法、装置、设备及存储介质
CN114422619B (zh) * 2020-10-12 2023-11-10 中国移动通信集团广东有限公司 业务识别方法、装置、设备及存储介质
CN113810310A (zh) * 2021-09-10 2021-12-17 北京云杉世纪网络科技有限公司 一种流量采集方法、装置、设备及存储介质
CN114339689A (zh) * 2021-12-30 2022-04-12 天翼物联科技有限公司 一种物联网机卡绑定池管控方法、装置及相关介质
CN114339689B (zh) * 2021-12-30 2023-12-22 天翼物联科技有限公司 一种物联网机卡绑定池管控方法、装置及相关介质

Also Published As

Publication number Publication date
CN110868436B (zh) 2021-03-23

Similar Documents

Publication Publication Date Title
CN110868436B (zh) 物联网数据采集方法和装置
CN107888605B (zh) 一种物联网云平台流量安全分析方法和系统
CN107623754B (zh) 基于真伪MAC识别的WiFi采集系统及其方法
CN112751835B (zh) 一种流量预警方法、系统、设备和存储介质
CN108092685B (zh) 双卡槽终端的双卡状态识别方法、装置、设备及介质
CN104283918A (zh) 一种无线局域网终端类型获取方法及系统
CN102857917B (zh) 一种基于信令分析的手机连接pc上网识别方法
CN113825129B (zh) 一种5g网络环境下工业互联网资产测绘方法
CN107105428A (zh) 快速补全终端信息库的方法及装置
CN110856188B (zh) 通信方法、装置、系统和计算机可读存储介质
CN105959934A (zh) 重入网识别方法和系统
CN110020161B (zh) 数据处理方法、日志处理方法和终端
CN105007177A (zh) 一种移动端数据和固网数据的映射方法
CN102045182B (zh) 一种业务故障确定方法、装置和系统
CN106454882A (zh) 一种获取用户话单xDR的方法和装置
US10762238B2 (en) Ascertaining network devices used with anonymous identifiers
CN102438228B (zh) Gprs骨干网数据关联用户信息的方法及系统
CN105279230A (zh) 通过主动学习方法构建互联网应用特征识别数据库的方法及系统
CN112688884B (zh) 加密流量自定义应用识别方法、系统、装置及存储介质
CN111225389B (zh) 一种移动数据流量处理的方法及装置
CN103634164B (zh) 一种获取流量信息的方法及系统
CN109067932B (zh) 一种数据采集终端无固定ip的数据传输方法及数据服务端
CN109362079B (zh) 数据处理方法及装置
CN104010048B (zh) 用于ip地址管理的设备和方法
CN107070887B (zh) 网络行为信息的处理方法、装置及缓存设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant