CN111385342A - 一种物联网行业识别方法、装置、电子设备及存储介质 - Google Patents

一种物联网行业识别方法、装置、电子设备及存储介质 Download PDF

Info

Publication number
CN111385342A
CN111385342A CN201811648007.9A CN201811648007A CN111385342A CN 111385342 A CN111385342 A CN 111385342A CN 201811648007 A CN201811648007 A CN 201811648007A CN 111385342 A CN111385342 A CN 111385342A
Authority
CN
China
Prior art keywords
internet
things
data packet
industry
packet group
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811648007.9A
Other languages
English (en)
Other versions
CN111385342B (zh
Inventor
张晶
高羽
李鹏
段辉
秦文丽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Mobile Communications Group Co Ltd
China Mobile Group Beijing Co Ltd
Original Assignee
China Mobile Communications Group Co Ltd
China Mobile Group Beijing Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Mobile Communications Group Co Ltd, China Mobile Group Beijing Co Ltd filed Critical China Mobile Communications Group Co Ltd
Priority to CN201811648007.9A priority Critical patent/CN111385342B/zh
Publication of CN111385342A publication Critical patent/CN111385342A/zh
Application granted granted Critical
Publication of CN111385342B publication Critical patent/CN111385342B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L67/00Network arrangements or protocols for supporting network services or applications
    • H04L67/01Protocols
    • H04L67/12Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D30/00Reducing energy consumption in communication networks
    • Y02D30/70Reducing energy consumption in communication networks in wireless communication networks

Abstract

本发明公开了一种物联网行业识别方法、装置、电子设备及存储介质,用以解决现有技术中物联网行业识别不安全的问题。所述方法包括:获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。

Description

一种物联网行业识别方法、装置、电子设备及存储介质
技术领域
本发明主要涉及网络管理技术领域,尤其涉及一种物联网行业识别方法、装置、电子设备及存储介质。
背景技术
物联网作为电信领域最为引人注目的新技术,是未来通信领域最有可能开启广阔增长空间的产业之一。随着运营商将发展物联网列为未来发展战略的最高优先级,并着手开始建设全面覆盖的物联网网络,使得物联网的应用场景、行业类别得到了迅速的丰富。
现有的物联网行业识别主要是基于网络接入点名称(Access Point Name,APN)、号段、终端国际移动设备识别码(International Mobile Equipment Identity,IMEI)号码、访问IP地址等信息来区分,但是这些信息均涉及用户敏感信息,业务识别过程会对网络安全造成威胁。因此,如何在保证网络安全的情况下,识别物联网行业是一个亟需解决的问题。
发明内容
本发明实施例提供了一种物联网行业识别方法、装置、电子设备及存储介质,用以解决现有技术中物联网行业识别不安全的问题。
本发明实施例提供了一种物联网行业识别方法,所述方法包括:
获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;
针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;
将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
进一步地,所述物联网行业识别模型的训练过程包括:
获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;
针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;
将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
进一步地,确定所述待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征的过程包括:
根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;
根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
进一步地,所述预先设置的特征包括:
下行/上行数据包个数比例、下行/上行数据包比特数的比例、上行数据包比特数的平均值、上行数据包比特数的中位数、上行数据包比特数的方差、上行数据包比特数小于64比特的个数、上行数据包比特数在64比特和128比特之间的个数、上行数据包比特数在128比特和256比特之间的个数、下行数据包比特数的平均值、下行数据包比特数的中位数、下行数据包比特数的方差、下行数据包比特数小于64比特的个数、下行数据包比特数在64比特和128比特之间的个数和下行数据包比特数在128比特和256比特之间的个数。
进一步地,所述物联网行业识别模型为采用随机森林算法构建的。
进一步地,所述方法还包括:
确定第二特征值的最大值和最小值,并根据预设的权重值,确定随机样本数据包组对应的第二特征值的范围;
根据当前的任意样本数据包组,采用预设的数据增强算法,随机生成第二特征值在所述范围内的随机样本数据包组。
本发明实施例提供了一种物联网行业识别装置,所述装置包括:
获取模块,用于获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;
确定模块,用于针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;
识别模块,用于将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
本发明实施例提供了一种电子设备,所述电子设备包括存储器和处理器:
所述处理器,用于读取所述存储器中的程序,执行下列过程:获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
进一步地,所述处理器,用于获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
进一步地,所述处理器,用于根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
进一步地,所述处理器,用于确定第二特征值的最大值和最小值,并根据预设的权重值,确定随机样本数据包组对应的第二特征值的范围;根据当前的任意样本数据包组,采用预设的数据增强算法,随机生成第二特征值在所述范围内的随机样本数据包组。
本发明实施例提供了一种电子设备,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行上述任一项所述方法的步骤。
本发明实施例提供了一种计算机可读存储介质,其存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行上述任一项所述方法的步骤。
本发明实施例提供了一种物联网行业识别方法、装置、电子设备及存储介质,所述方法包括:获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。由于本发明实施例中通过物联网监控平台和物联网设备之间交互的上行数据包和下行数据包的数量和长度确定第一特征值,根据该第一特征值及预先训练完成的物联网行业识别模型,识别物联网行业,并不涉及用户的隐私信息,因此保证了物联网行业识别的安全性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简要介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种物联网行业识别方法的过程示意图;
图2为本发明实施例提供的物联网行业识别模型的训练结果示意图;
图3为本发明实施例提供的物联网行业识别模型的循环检测结果示意图;
图4为本发明实施例提供的一种目标特征选择方法的流程示意图;
图5为本发明实施例提供的样本数据包组的存储路径示例图;
图6为本发明实施例提供的执行物联网行业识别模型训练的方式示意图;
图7为本发明实施例提供的执行物联网行业识别模型训练的结果示意图;
图8为本发明实施例提供的物联网行业识别模型训练结果的存储路径示意图;
图9为本发明实施例提供的待识别物联网行业数据包组的存储路径示例图;
图10为本发明实施例提供的执行物联网行业识别模型的方式示意图;
图11为本发明实施例提供的执行物联网行业识别模型的结果示意图;
图12为本发明实施例提供的一种物联网行业识别装置的结构示意图;
图13为本发明实施例提供的一种电子设备;
图14为本发明实施例提供的一种电子设备。
具体实施方式
下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
实施例1:
图1为本发明实施例提供的一种物联网行业识别方法的过程示意图,该过程包括以下步骤:
S101:获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包。
为了提高物联网行业识别的安全性,在本发明实施例中,采用物联网设备和物联网监控平台之间交互的上行及下行数据包的数量和长度特征来识别这些交互的数据包所归属的物联网行业。
首先,可以预先设定时间长度,比如15分钟,在该时间长度内采集物联网监控平台向第一物联网设备发送的每个上行数据包,比如指令等信息,另外还获取该第一物联网设备向物联网监控平台发送的每个下行数据包,比如针对接收的指令的执行结果等信息。由于物联网设备在和物联网监控平台进行数据交互的时候会携带自身的IP地址等标识信息,所以针对该第一物联网设备,可以采集到该第一物联网设备和物联网监控平台之间在设定时间长度内传输的每个上行数据包和每个下行数据包。
S102:针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值。
为了提高物联网行业识别的准确性,在本发明实施例中训练完成的物联网行业识别模型可识别一种物联网行业,因此在进行物联网行业识别时,可以针对识别每个物联网行业的物联网行业识别模型,分别进行操作。
为了能够准确的识别每个物联网行业,每个物联网行业对应的目标特征都是不同的,在本发明实施例中针对每个物联网行业预先保存了该物联网行业对应的目标特征。在上述步骤S101中获取了设定时间长度内物联网监控平台和第一物联网设备直接交互的每个上行数据包和每个下行数据包,为了针对第一物联网设备获取该物联网设备对应的第一特征值,将该第一物联网设备与物联网监控平台在该设定时间长度内传输的每个上行数据包和每个下行数据包确定为一个数据包组。
根据预先保存的该物联网行业对应的每个目标特征,确定该数据包组的每个第一特征值。具体的,根据该数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定该第一物联网设备对应的能识别的物联网行业的每个目标特征的第一特征值,比如上行数据包和下行数据包总的比特数的比值等。
在进行物联网行业识别时,可以针对已经训练完成的每个物联网行业网识别模型,针对该物联网识别模型能识别的物联网行业,由于每个物联网行业对应的目标特征都是不同的,所以根据预先保存的物联网行业和该物联网行业对应的每个目标特征,分别确定该数据包组相对每个物联网行业的第一特征值,比如如果物联网识别模型能识别的物联网行业为智能灯杆行业,则确定智能灯杆行业对应的目标特征,进而则根据获取的上行数据包和下行数据包的数据量、每个数据包的长度,确定该数据包组对应智能灯杆行业的第一特征值。
S103:将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
为了识别第一物联网设备是否为该预先训练完成的物联网行业识别模型能偶识别的物联网行业,确定了该第一物联网设备与物联网监控平台间传输的数据包组对应的每个第一特征值之后,根据该第一物联网设备与物联网监控平台之间传输的数据包组、及该数据包组对应的第一特征值确定为该数据包组对应的特征向量。将该数据包组对应的特征向量输入到物联网行业识别模型中,该物联网行业识别模型根据该数据包组对应的特征向量,判断该该数据包组是否归属于该物联网行业识别模型能识别的物联网行业。具体的,该物联网行业识别模型可以输出该数据包组是否归属于能识别的物联网行业的标识信息,比如当该该数据包组归属于能识别的物联网行业时,输出1,当该该数据包组不归属于能识别的物联网行业时,输出0。
由于本发明实施例中通过物联网监控平台和物联网设备之间交互的上行数据包和下行数据包的数量和长度确定第一特征值,根据该第一特征值及预先训练完成的物联网行业识别模型,识别物联网行业,并不涉及用户的隐私信息,因此保证了物联网行业识别的安全性。
实施例2:
为了确定数据包组所属的物联网行业,在上述实施例的基础上,在本发明实施例中,所述物联网行业识别模型的训练过程包括:
获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;
针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;
将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
为了完成对物联网行业识别模型的训练,以提高该物联网行业识别模型的准确率,需要获取大量的样本数据。具体的,可以预设一定的时间长度,针对每个第二物联网设备,获取在该设定时间长度内物联网监控平台向该第二物联网设备发送的上行数据包,比如指令等信息,另外还获取该第二物联网设备向物联网监控平台发送的下行数据包,比如针对接收的指令的执行结果等信息,由于每个物联网设备在和物联网监控平台进行数据交互的时候会携带自身的IP地址等标识信息,所以针对每个第二物联网设备,将该第二物联网设备和物联网监控平台之间,在设定时间长度内传输的每个上行数据包和每个下行数据包确定为样本数据包组。
另外为了可以在模型训时可以校验该物联网行业识别模型的输出结果,在本发明实施例中,为每个样本数据包组标记了该样本数据包是否属于待训练物联网行业识别模型所能识别的物联网行业的标识信息,具体的,可以采用该方式标记:如果该样本数据包组属于待训练物联网行业识别模型所能识别的物联网行业,则为该样本数据包组标记1;如果该样本数据包组不属于待训练物联网行业识别模型所能识别的物联网行业,则为该样本数据包组标记0。
具体的,在本发明实施例中,通过与物联网设备厂商的行业调研,获取指定物联网行业的关键业务流程,从而进行物联网设备的手动触发测试,在设备厂商配合的情况下,获取物联网厂商的后台操作权限,记录手动测试时的结果。如表1所示,该表以智能灯杆设备为例,记录了针对该智能灯杆设备,在设定时间长度内获取的数据包组。其中该预设时间长度为从17:56到18:25,以5分钟左右的时间为间隔,人为进行测试,并记录手动测试时的结果,获取该智能灯杆设备的上行数据包(包括测试时间、测试行为流程等)和下行数据包(包括测试结果等),进而确定该物联网设备的样本数据包组。
Figure BDA0001932400310000101
表1
针对多个物联网设备,采用相同的方式获取多个样本数据包组。在本发明实施例中,针对每个想要识别的物联网行业确定了对应的物联网行业识别模型,即如果想要识别的物联网行业为智能灯杆行业,针对该智能灯杆行业确定了物联网行业识别模型,则该物联网行业识别模型则能够识别出归属于智能灯杆行业的数据包。
在进行模型训练的时候,针对待训练的物联网行业识别模型,确定该物联网行业识别模型能够识别的物联网行业。为了能够准确的识别每个物联网行业,每个物联网行业对应的目标特征都是不同的,在本发明实施例中针对每个物联网行业预先保存了该物联网行业对应的目标特征,进而可以根据预先保存的该物联网行业对应的每个目标特征,确定针对每个样本数据包组对应的第二特征值。具体的,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应的上述能够识别的物联网行业的每个目标特征的第二特征值,比如上行数据包和下行数据包总的比特数的比值。
在确定了每个样本数据包组的对应的第二特征值之后,就可以对该物联网行业识别模型进行训练了。针对每个第二物联网设备,根据该第二物联网设备和物联网监控平台之间传输的样本数据包组、该样本数据包组对应的第二特征值、该样本数据包组是否属于待训练物联网行业识别模型能识别的物联网行业的标识信息,确定该样本数据包组对应的样本特征向量。将每个样本数据包组对应的样本特征向量输入到物联网行业识别模型中,根据该物联网行业识别模型的输出和每个样本数据包组是否属于该物联网行业的标识信息对该模型进行训练。
实施例3:
为了得到更精确的物联网行业识别模型,在上述实施例的基础上,在本发明实施例中,所述物联网行业识别模型为采用随机森林算法构建的。
在本发明实施例中采用随机森林算法构建该物联网行业识别模型。随机森林算法属于集成学习的算法,从原始数据中有放回的随机选取一部分训练样本来训练决策树,共进行K轮抽取,得到K棵决策树,最后通过投票来表决分类结果。目前采用的随机森林中采用的决策树为CART树(分类回归树),其中决策树的个数可以设置为10,每棵树的最大深度可以为4。将待训练物联网行业识别模型能识别的物联网行业和其他物联网行业的样本数据包组、对应的第二特征值及该样本数据包组是否归属于能识别的物联网行业的标识信息输入到基于随机森林算法的物联网行业识别模型中,根据该物联网行业识别模型的输出,对该物联网行业识别模型进行训练。
为了提高物联网行业识别模型的准确性,可以在其他物联网行业的样本数据包组中加入一定的随机数据,以增大其他物联网行业的覆盖范围。随机数据的生成规则是基于当前的样本数据包组中的数据,采用特定的数据增强算法,比如可以采用随机改变大小、增加噪声、翻转变换等方式,增加样本数据包组的数量。并且为了保证生成的随机数据的可用性,需先根据当前获取的真实数据确定第二特征值对应的最大值和最小值,在第二特征值为[0.8*最小值,1.2*最大值]的范围内,随机生成在该范围内的第二特征值对应的样本数据包组,将生成的样本数据包组,补充到其他物联网行业的数据中。
图2为采用本发明实施例提供的物联网行业识别模型对样本数据包组的识别结果,其中圆形代表了待训练物联网行业识别模型能识别的物联网行业的样本数据包组,三角形代表了其他物联网行业的样本数据包组,方形代表了产生的随机数据构成的样本数据包组。若只将待训练物联网行业识别模型能识别的物联网行业的样本数据包组和其他物联网行业的样本数据包组作为该物联网行业识别模型的输入,得到的分类结果的边界为图2中的虚线所示,可见界限模糊、并且对待识别的物联网行业和其他物联网行业的划分不够明显。而若在其他物联网行业样本数据包组又补充了方形的随机数据构成的样本数据包组之后,将所有的样本数据包组作为该物联网行业识别模型的输入,得到的分类结果的边界就为图2中左上角的框图所示,可以看出界限清晰分明,清楚的确定了待识别物联网行业的样本数据包组。
为了进一步提升物联网行业识别模型的准确度,在本发明实施例中,还以设定时间长度内获取的数据包的个数为一个周期,采用序贯贝叶斯算法对物联网行业识别模型进行循环检测,具体检测过程为现有技术,在此不再赘述。序贯贝叶斯算法的计算公式如下:
Figure BDA0001932400310000121
最后输出的结果如图3所示,其中,柱状图表示的是物联网行业识别模型识别错误的样本数据包组,由图3可以看出,在第2、3、7、9、12、16、20、23、27、31个样本数据包组时输出了错误的物联网行业的识别结果,可见随着训练采用的样本数据包组的数量的增多,在相同样本数据包组的情况下,出现识别错误的结果越来越少,比如在1-7之间出现了3次识别错误的结果,在8-14之间出现了2次,15-21之间也出现了2次,22-28之间出现了2次,29-35之间出现了1次。另外曲线表示的是经过序贯贝叶斯算法计算得到的识别错误的概率,由图3可以看出随着样本数据包组的数量的增加,识别错误的概率越来越小,趋于稳定,因此即使有几个周期的错误识别,最终也不会改变整体的识别结果,提升了物联网行业识别模型的稳定性。
本发明实施例中,通过获取包含设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包的样本数据包组,根据每个样本数据包组、对应的第二特征值以及该样本数据包组是否为待识别物联网行业的标识信息对物联网行业识别模型进行训练,以使得该物联网行业识别模型可以确定数据包组是否归属于待识别物联网行业。
实施例4:
为了确定样本数据包组的目标特征以用于物联网行业识别模型的训练,在上述各实施例的基础上,在本发明实施例中,确定所述待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征的过程包括:
根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;
根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
为了提取样本数据包组的目标特征,在本发明实施例,首先经过大量的仿真以及从计算量和获取难易程度的方面预先设置了多个特征,具体的,为了消除移动网络状况对识别性能的影响,在特征提取的选择上,尽可能的不采用那些跟当前网络状态相关的时间维度的信息以及上/下行数据包总比特数这类的信息,因此在本发明实施例中采用了如表2所示的14个特征,该14个特征是根据在设定时间长度内获取的物联网设备和物联网监控平台之间进行交互的上行数据包和下行数据包的数量、每个数据包的长度确定的,包括:下行/上行数据包个数比例、下行/上行数据包比特数的比例、上行数据包比特数的平均值、上行数据包比特数的中位数、上行数据包比特数的方差、上行数据包比特数小于64的个数、上行数据包比特数在64和128之间的个数、上行数据包比特数在128和256之间的个数、下行数据包比特数的平均值、下行数据包比特数的中位数、下行数据包比特数的方差、下行数据包比特数小于64的个数、下行数据包比特数在64和128之间的个数和下行数据包比特数在128和256之间的个数,并且为了方便在物联网行业识别模型训练和测试时描述每个特征,该每个特征均有自身对应的特征编号。
Figure BDA0001932400310000141
表2
由于上述实施例中是在设定时间长度获取一定数量的上行数据包和下行数据包并确定样本数据包组的,因此在进行特征提取的时候也以设定时间长度内获取的样本数据包组为一个周期进行特征提取。具体的,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定上述每个预设特征对应的每个第三特征值。
为了进一步得到该样本数据包组对应的待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个特征及每个特征对应的第三特征值,采用随机森林算法确定每个目标特征。经过随机森林算法的特征筛选,可以自适应的针对不同的物联网行业,在上述14个特征中选择该物联网行业最重要的设定数量的目标特征,在明显减少计算量的情况下,保证物联网行业识别模型的识别性能不会下降。
具体的,将获取的样本数据包组的特征及对应的每个第三特征值输入到基于随机森林算法的分类器中,其中,采用随机森林算法选择目标特征为现有技术,在此不再赘述。比如可以通过调用已经封装好的sklearn库中的随机森林算法的函数构成随机森林打分器,如图4所示,对上述每个特征进行打分,即计算每个特征的重要度,在得到每个特征的重要度之后,根据该重要度从大到小对每个特征进行排序,选择排名靠前的设定数量的特征作为目标特征,比如可以选择排名位于前7位的特征作为目标特征。
本发明实施例中,通过采用随机森林算法,确定了样本数据包组对应的目标特征,实现了对物联网行业识别模型的训练。
下面以一个具体的实施例对上述各实施例进行详细说明,包括以下步骤:
步骤1:原始数据的获取。
通过手动测试的方式,获取原始数据包(即样本数据包组),将原始数据包转换为标准的.cap文件,在物联网行业识别模型训练运行前,可将原始数据包存放在预设路径中。将要识别的物联网行业,比如智能灯杆的.cap文件放置在“D:\00IoTTool\00IoTModelData\01lightdata”这个路径下,同时将其他物联网行业的文件放在指定路径“D:\00IoTTool\00IoTModelData\02rubbishbindata”和“D:\00IoTTool\00IoTModelData\03mobaibikedata”,如图5所示。
步骤2:物联网行业识别模型的训练。
运行预先编写的“Industry_Classify.exe”文件,训练该物联网行业识别模型,可以有两种执行方式,如图6所示。
A、直接双击此“Industry_Classify.exe”文件运行;
B、也可以在cmd窗口下定位到“Industry_Classify.exe”文件所在的文件夹路径(本文示例在D:\00IoTTool\00IoTModel\00IoTModelTrain),然后执行Industry_Classify.exe命令运行。
根据训练该模型的原始数据量的大小,“Industry_Classify.exe”运行一段时间(分钟或小时或天级别)后,会输出两个有效文件“OutputFile.csv”和“rf_save.pkl”,如图7划线部分所示,其他文件为过程文件,不用关注。其中“rf_save.pkl”为输出的物联网行业识别模型文件,“OutputFile.csv”为输出的中间结果包含有目标特征的编号。
步骤3:物联网行业识别。
为了完成物联网行业的识别,将上一节物联网行业识别模型训练阶段产生的“OutputFile.csv”、“rf_save.pkl”两个文件复制到物联网行业识别执行文件“Model_To_Classify.exe”所在的目录下,如图8划线部分所示。
然后在“Model_To_Classify.exe”所在的目录下创建“InputFile.csv”文件,在此文件中输入想要测试的.cap文件的存放地址,要使用绝对地址,比如如图9所示的“D:\00IoTTool\00IoTModelData\APP_test”,并将需要进行模型识别的数据放置在指定的文件夹下“D:\00IoTTool\00IoTModelData\APP_test”。
将测试数据放入指定目录下之后,运行“Model_To_Classify.exe”文件,进行测试数据的物联网行业识别,如图10所示,有两种执行方式。
A、可以直接双击此“Model_To_Classify.exe”文件运行;
B、也可以在cmd窗口下定位到exe文件所在的文件夹路径(本文示例在D:\00IoTTool\00IoTModel\01IoTModelShow),然后执行Model_To_Classify.exe命令运行。
“Model_To_Classify.exe”文件运行完毕后,会输出一个有效文件“FlowResults.csv”,如图11所示,其中“FlowResults.csv”中包含的字段说明:
Tuple_Info:表示流的五元组信息;
LogFile:对应的.cap文件;
TimeStamp:数据包的时间;
results:代表物联网识别模型的输出结果,1表示该物联网识别模型能识别的物联网行业,0表示其他物联网行业。
以上各步骤的具体实施过程在上述各实施例中均有详细描述,在此不再赘述。
实施例5:
基于相同的技术构思,本发明实施例提供一种物联网行业识别装置。本发明实施例提供的装置如图12所示,该装置包括:
获取模块1201,用于获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;
确定模块1202,用于针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;
识别模块1203,用于将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
进一步地,所述装置还包括:训练模块1204,用于获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
进一步地,所述训练模块1204,具体用于根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
进一步地,所述训练模块1204,还用于确定第二特征值的最大值和最小值,并根据预设的权重值,确定随机样本数据包组对应的第二特征值的范围;根据当前的任意样本数据包组,采用预设的数据增强算法,随机生成第二特征值在所述范围内的随机样本数据包组。
实施例6:
在上述各实施例的基础上,本发明实施例还提供了一种电子设备1300,如图13所示,包括存储器1301和处理器1302;
所述处理器1302,用于读取所述存储器1301中的程序,执行下列过程:
获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;
针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;
将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
在图13中,总线架构可以包括任意数量的互联的总线和桥,具体由处理器1302代表的一个或多个处理器和存储器1301代表的存储器的各种电路链接在一起。总线架构还可以将诸如外围设备、稳压器和功率管理电路等之类的各种其他电路链接在一起,这些都是本领域所公知的,因此,本文不再对其进行进一步描述。
可选的,处理器1302可以是CPU(中央处埋器)、ASIC(Application SpecificIntegrated Circuit,专用集成电路)、FPGA(Field-Programmable Gate Array,现场可编程门阵列)或CPLD(Complex Programmable Logic Device,复杂可编程逻辑器件)。
所述处理器,用于获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
所述处理器,用于根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
所述处理器,用于确定第二特征值的最大值和最小值,并根据预设的权重值,确定随机样本数据包组对应的第二特征值的范围;根据当前的任意样本数据包组,采用预设的数据增强算法,随机生成第二特征值在所述范围内的随机样本数据包组。
实施例7:
在上述各实施例的基础上,本发明实施例还提供了一种电子设备1400,如图14所示,包括:处理器1401、通信接口1402、存储器1403和通信总线1404,其中,处理器1401,通信接口1402,存储器1403通过通信总线1404完成相互间的通信;
所述存储器1403中存储有计算机程序,当所述程序被所述处理器1401执行时,使得所述处理器1401执行如下步骤:
获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;
针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;
将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
进一步地,所述处理器用于获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
进一步地,所述处理器用于根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
所述处理器,用于确定第二特征值的最大值和最小值,并根据预设的权重值,确定随机样本数据包组对应的第二特征值的范围;根据当前的任意样本数据包组,采用预设的数据增强算法,随机生成第二特征值在所述范围内的随机样本数据包组。
上述电子设备提到的通信总线可以是外设部件互连标准(Peripheral ComponentInterconnect,PCI)总线或扩展工业标准结构(Extended Industry StandardArchitecture,EISA)总线等。该通信总线可以分为地址总线、数据总线、控制总线等。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
通信接口1402用于上述电子设备与其他设备之间的通信。
存储器可以包括随机存取存储器(Random Access Memory,RAM),也可以包括非易失性存储器(Non-Volatile Memory,NVM),例如至少一个磁盘存储器。可选地,存储器还可以是至少一个位于远离前述处理器的存储装置。
上述处理器可以是通用处理器,包括中央处理器、网络处理器(NetworkProcessor,NP)等;还可以是数字指令处理器(Digital Signal Processing,DSP)、专用集成电路、现场可编程门陈列或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。
实施例7:
在上述各实施例的基础上,本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质内存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行时实现如下步骤:
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行如下步骤:
获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;
针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;
将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
进一步地,所述处理器用于获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
进一步地,所述处理器用于根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
所述处理器,用于确定第二特征值的最大值和最小值,并根据预设的权重值,确定随机样本数据包组对应的第二特征值的范围;根据当前的任意样本数据包组,采用预设的数据增强算法,随机生成第二特征值在所述范围内的随机样本数据包组。
上述计算机可读存储介质可以是电子设备中的处理器能够存取的任何可用介质或数据存储设备,包括但不限于磁性存储器如软盘、硬盘、磁带、磁光盘(MO)等、光学存储器如CD、DVD、BD、HVD等、以及半导体存储器如ROM、EPROM、EEPROM、非易失性存储器(NANDFLASH)、固态硬盘(SSD)等。
对于系统/装置实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者一个操作与另一个实体或者另一个操作区分开来,而不一定要求或者暗示这些实体或者操作之间存在任何这种实际的关系或者顺序。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全应用实施例、或结合应用和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。
显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

Claims (13)

1.一种物联网行业识别方法,其特征在于,所述方法包括:
获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;
针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;
将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
2.如权利要求1所述的方法,其特征在于,所述物联网行业识别模型的训练过程包括:
获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;
针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;
将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
3.如权利要求2所述的方法,其特征在于,确定所述待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征的过程包括:
根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;
根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
4.如权利要求3所述的方法,其特征在于,所述预先设置的特征包括:
下行/上行数据包个数比例、下行/上行数据包比特数的比例、上行数据包比特数的平均值、上行数据包比特数的中位数、上行数据包比特数的方差、上行数据包比特数小于64比特的个数、上行数据包比特数在64比特和128比特之间的个数、上行数据包比特数在128比特和256比特之间的个数、下行数据包比特数的平均值、下行数据包比特数的中位数、下行数据包比特数的方差、下行数据包比特数小于64比特的个数、下行数据包比特数在64比特和128比特之间的个数和下行数据包比特数在128比特和256比特之间的个数。
5.如权利要求1-3任一项所述的方法,其特征在于,所述物联网行业识别模型为采用随机森林算法构建的。
6.如权利要求2所述的方法,其特征在于,所述方法还包括:
确定第二特征值的最大值和最小值,并根据预设的权重值,确定随机样本数据包组对应的第二特征值的范围;
根据当前的任意样本数据包组,采用预设的数据增强算法,随机生成第二特征值在所述范围内的随机样本数据包组。
7.一种物联网行业识别装置,其特征在于,所述装置包括:
获取模块,用于获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;
确定模块,用于针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;
识别模块,用于将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
8.一种电子设备,其特征在于,所述电子设备包括存储器和处理器:
所述处理器,用于读取所述存储器中的程序,执行下列过程:获取设定时间长度内物联网监控平台向第一物联网设备发送的每个上行数据包、及第一物联网设备向物联网监控平台发送的每个下行数据包;针对物联网行业识别模型能够识别的物联网行业,确定该物联网行业对应的每个目标特征,根据上行数据包和下行数据包的数量、及每个数据包的长度,确定所述第一物联网设备对应所述物联网行业的每个第一特征值;将每个数据包及确定的第一特征值输入到预先训练完成的物联网行业识别模型中,确定所述每个数据包构成的数据包组是否归属于所述物联网行业。
9.如权利要求8所述的电子设备,其特征在于,所述处理器,用于获取每个样本数据包组,其中每个样本数据包组包括设定时间长度内第二物联网设备与物联网监控平台间传输的上行数据包和下行数据包;针对待训练的物联网行业识别模型能够识别的物联网行业对应的每个目标特征,根据每个样本数据包组中包含的上行数据包和下行数据包的数量、及每个数据包的长度,确定每个样本数据包组对应所述物联网行业的每个第二特征值;将每个样本数据包组、对应的第二特征值以及该样本数据包组是否为所述物联网行业的标识信息输入到物联网行业识别模型中,对该物联网行业识别模型进行训练。
10.如权利要求9所述的电子设备,其特征在于,所述处理器,用于根据预先设置的每个特征,及每个样本数据包组中的上行数据包和下行数据包的数量、及每个数据包的长度,确定该样本数据包组的每个第三特征值;根据每个特征及每个特征对应的第三特征值,采用预设的随机森林算法,确定目标特征。
11.如权利要求9所述的电子设备,其特征在于,所述处理器,用于确定第二特征值的最大值和最小值,并根据预设的权重值,确定随机样本数据包组对应的第二特征值的范围;根据当前的任意样本数据包组,采用预设的数据增强算法,随机生成第二特征值在所述范围内的随机样本数据包组。
12.一种电子设备,其特征在于,包括:处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;
所述存储器中存储有计算机程序,当所述程序被所述处理器执行时,使得所述处理器执行权利要求1-6任一项所述方法的步骤。
13.一种计算机可读存储介质,其特征在于,其存储有可由电子设备执行的计算机程序,当所述程序在所述电子设备上运行时,使得所述电子设备执行权利要求1-6任一项所述方法的步骤。
CN201811648007.9A 2018-12-29 2018-12-29 一种物联网行业识别方法、装置、电子设备及存储介质 Active CN111385342B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811648007.9A CN111385342B (zh) 2018-12-29 2018-12-29 一种物联网行业识别方法、装置、电子设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811648007.9A CN111385342B (zh) 2018-12-29 2018-12-29 一种物联网行业识别方法、装置、电子设备及存储介质

Publications (2)

Publication Number Publication Date
CN111385342A true CN111385342A (zh) 2020-07-07
CN111385342B CN111385342B (zh) 2023-04-07

Family

ID=71216901

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811648007.9A Active CN111385342B (zh) 2018-12-29 2018-12-29 一种物联网行业识别方法、装置、电子设备及存储介质

Country Status (1)

Country Link
CN (1) CN111385342B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112383431A (zh) * 2020-11-13 2021-02-19 武汉虹旭信息技术有限责任公司 互联网中物联网数据的识别方法及装置

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105451265A (zh) * 2014-08-29 2016-03-30 中国移动通信集团公司 一种多用户下行数据的处理方法、装置及终端
US20160112381A1 (en) * 2014-10-20 2016-04-21 Tata Consultancy Services Ltd. Computer Implemented System and Method for Secure Session Establishment and Encrypted Exchange of Data
CN105991593A (zh) * 2015-02-15 2016-10-05 阿里巴巴集团控股有限公司 一种识别用户风险的方法及装置
CN108234345A (zh) * 2016-12-21 2018-06-29 中国移动通信集团湖北有限公司 一种终端网络应用的流量特征识别方法、装置和系统
WO2018125053A1 (en) * 2016-12-27 2018-07-05 Intel IP Corporation Framework for iot protocol identification and management
CN108667747A (zh) * 2018-04-28 2018-10-16 深圳信息职业技术学院 网络流应用类型识别的方法、装置及计算机可读存储介质
CN109063777A (zh) * 2018-08-07 2018-12-21 北京邮电大学 网络流量分类方法、装置及实现装置

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105451265A (zh) * 2014-08-29 2016-03-30 中国移动通信集团公司 一种多用户下行数据的处理方法、装置及终端
US20160112381A1 (en) * 2014-10-20 2016-04-21 Tata Consultancy Services Ltd. Computer Implemented System and Method for Secure Session Establishment and Encrypted Exchange of Data
CN105991593A (zh) * 2015-02-15 2016-10-05 阿里巴巴集团控股有限公司 一种识别用户风险的方法及装置
CN108234345A (zh) * 2016-12-21 2018-06-29 中国移动通信集团湖北有限公司 一种终端网络应用的流量特征识别方法、装置和系统
WO2018125053A1 (en) * 2016-12-27 2018-07-05 Intel IP Corporation Framework for iot protocol identification and management
CN108667747A (zh) * 2018-04-28 2018-10-16 深圳信息职业技术学院 网络流应用类型识别的方法、装置及计算机可读存储介质
CN109063777A (zh) * 2018-08-07 2018-12-21 北京邮电大学 网络流量分类方法、装置及实现装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
李君等: "基于智能业务识别的可信路由研究", 《电信科学》 *

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112383431A (zh) * 2020-11-13 2021-02-19 武汉虹旭信息技术有限责任公司 互联网中物联网数据的识别方法及装置

Also Published As

Publication number Publication date
CN111385342B (zh) 2023-04-07

Similar Documents

Publication Publication Date Title
CN112417439B (zh) 账号检测方法、装置、服务器及存储介质
CN103927483A (zh) 用于检测恶意程序的判定模型及恶意程序的检测方法
CN109033772A (zh) 一种验证信息的输入方法及装置
CN113271237B (zh) 工控协议的解析方法、装置、存储介质及处理器
CN112711757B (zh) 一种基于大数据平台的数据安全集中管控方法及系统
CN112419268A (zh) 一种输电线路图像缺陷检测方法、装置、设备及介质
CN111338692A (zh) 基于漏洞代码的漏洞分类方法、装置及电子设备
CN113610156A (zh) 用于大数据分析的人工智能模型机器学习方法及服务器
CN113052577A (zh) 一种区块链数字货币虚拟地址的类别推测方法及系统
CN106301979A (zh) 检测异常渠道的方法和系统
CN108182282A (zh) 地址真实性验证方法、装置及电子设备
CN111385342B (zh) 一种物联网行业识别方法、装置、电子设备及存储介质
CN112598326A (zh) 模型迭代方法、装置、电子设备及存储介质
CN111385273B (zh) 一种物联网业务流程识别方法、装置、电子设备及介质
CN106682516A (zh) 应用程序的检测方法、检测装置和服务器
CN111224919B (zh) 一种ddos识别方法、装置、电子设备及介质
CN111325255A (zh) 特定人群圈定方法、装置、电子设备及存储介质
CN112527573A (zh) 一种接口测试方法、装置及存储介质
CN107517474B (zh) 一种网络分析优化方法及装置
CN110661913A (zh) 一种用户排序方法、装置及电子设备
CN110263618A (zh) 一种核身模型的迭代方法和装置
CN115567371A (zh) 一种异常检测方法、装置、设备及可读存储介质
CN115037790A (zh) 异常注册识别方法、装置、设备及存储介质
CN113076451B (zh) 异常行为识别和风险模型库的建立方法、装置及电子设备
CN115658492A (zh) 内核配置项异常值的检测方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant