CN105654112A - 一种高效的物联网标识编码划分方法 - Google Patents

一种高效的物联网标识编码划分方法 Download PDF

Info

Publication number
CN105654112A
CN105654112A CN201510971553.6A CN201510971553A CN105654112A CN 105654112 A CN105654112 A CN 105654112A CN 201510971553 A CN201510971553 A CN 201510971553A CN 105654112 A CN105654112 A CN 105654112A
Authority
CN
China
Prior art keywords
feature
code
cluster
identification
sum
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201510971553.6A
Other languages
English (en)
Other versions
CN105654112B (zh
Inventor
李晓东
吴腾
周琳琳
孔宁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
China Internet Network Information Center
Original Assignee
China Internet Network Information Center
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by China Internet Network Information Center filed Critical China Internet Network Information Center
Priority to CN201510971553.6A priority Critical patent/CN105654112B/zh
Publication of CN105654112A publication Critical patent/CN105654112A/zh
Application granted granted Critical
Publication of CN105654112B publication Critical patent/CN105654112B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • G06F18/232Non-hierarchical techniques
    • G06F18/2321Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
    • G06F18/23213Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种高效的物联网标识编码划分方法。本方法为:1)选取用于互联网标识编码划分的若干特征,并为每一特征设定一权值;2)对所选特征进行归一化处理;3)对选取的编码标识样本进行聚类,其中将上述权值作为所选聚类算法的度量函数中度量分量的系数;4)对每个聚类中心的特征进行加权计算得到对应聚类的得分;5)对于一待划分的编码标识,从该编码标识中提取与步骤1)相同的若干特征,然后计算与步骤4)每一聚类中心的相似性,将该待划分编码标识分配到最相似的类别中。本发明在保证一定准确度的条件下,对编码的划分速度得到了显著提高。

Description

一种高效的物联网标识编码划分方法
技术领域
本发明涉及一种高效的物联网标识编码划分方法,属于计算机网络技术领域。
背景技术
近年来物联网相关技术成为世界经济和科技发展的战略制高点。各个标准机构和组织发布了各种物联网标识的标准,造成了物联网标识体系混乱、标识质量参次不齐的现状。
目前识别各类物联网标识的算法有较高的识别速度。经过研究发现,标识识别过程中经常出现标准冲突无法避免的情况;对于拥有标准的组织,高质量的标识的产生,对此类标准的推广至关重要。同时,对于管理众多标准的国家来说,需要一个评价体系来甄别一个标准中的优秀标识,如果一个标准中低质量的标识占的比例太大,可以考虑淘汰部分设计不合理的标准。
发明内容
针对现有技术中存在的技术问题,本发明的目的在于提供一种高效的物联网标识编码划分方法。对于某个特定的编码标准,根据标准产生的标识中,部分是冲突较小、查询速度快的高质量标识,部分是冲突较大、查询速度慢的低质量标识,如何划分这些标识对于标准推广组织有重要意义。
本发明基于标识识别系统(参考申请号:201410186428.X,名称“一种物联网异构标识识别方法和系统”的专利申请),提取了标识解析过程中的多维特征,将原来不可划分的标识通过特征区分开来,在这些特征的基础上提出一种支持特征权值配置的标识快速划分方法。通过历史模型的离线计算,和新输入标识的在线计算,在保证一定准确度的条件下,划分速度得到了显著提高。
本发明的技术方案为:
一种高效的物联网标识编码划分方法,其步骤为:
1)选取用于互联网标识编码划分的若干特征,并为每一特征设定一权值;
2)对所选特征进行归一化处理;
3)对选取的编码标识样本进行聚类,其中将上述权值作为所选聚类算法的度量函数中度量分量的系数;
4)对每个聚类中心的特征进行加权计算得到对应聚类的得分;
5)对于一待划分的编码标识,从该编码标识中提取与步骤1)相同的若干特征,然后计算与步骤4)每一聚类中心的相似性,将该待划分编码标识分配到最相似的类别中。
进一步的,所述用于互联网标识编码划分的特征包括:标识在标识识别系统中运行时的匹配次数,标识的长度,通过长度筛选后的标准集合大小,函数规则的字节长度,最终的标准集合大小。
进一步的,选取出所述用于互联网标识编码划分的特征的方法为:首先在标识识别系统中提取编码标识特征:是否包含字母,函数规则的个数,是否包含校验算法,标识在标识识别系统中运行时的匹配次数,标识的长度,通过长度筛选后的标准集合大小,函数规则的字节长度,最终的标准集合大小;然后对初步提取的编码标识特征进行聚类,确定出所述用于互联网标识编码划分的特征。
进一步的,对初步提取的编码标识特征进行聚类,确定出所述用于互联网标识编码划分的特征的方法为:对于每一初步提取的编码标识特征进行聚类时,计算不同聚类之间的平方和 SS j , Between = Σ k K | C k | ( μ j - μ j k ) 2 以及聚类簇内的样本平方和 SS j , Within = Σ i n ( x ji ( i ∈ C k ) - μ j k ) 2 ; 其中SSj,Between表示对于第j个编码标识特征,不同聚类之间的平方和,K是设定的聚类总数,|Ck|表示第k个聚类的样本数,μj是对于第j个编码标识特征,所有样本的均值,是对于第j个编码标识特征,第k个聚类的均值;SSj,Within是对于第j个编码标识特征,聚簇内样本的平方和,n表示编码标识的总数,是第i个编码标识对应于第j个编码标识特征聚类时的取值;然后计算该编码标识特征对应的平方和比例最后根据平方和比例值选取出所述用于互联网标识编码划分的特征。
进一步的,确定每一特征的权值的方法为:
1)建立一决策矩阵A=Rn*d;其中,d为特征总数,n为编码标识样本个数;
2)对矩阵A进行规范化得到一矩阵R;
3)对于矩阵R的每一行,建立一单目标决策模型;解此单目标决策模型得到对应行的最优目标权重向量;
4)将各行对应的最优目标权重向量组成一矩阵W,计算(RTW)T(RTW)的最大特征值λmax及特征向量w;
5)对特征向量w进行归一化处理得到各个特征的权值。
进一步的,所述单目标决策模型为其中,0.05≤ki<1,i=1,2,...,d,
进一步的,所述度量函数为欧几里得距离函数,计算两编码标识的距离 d ( i , j ) = k 1 * ( x i 1 - x j 1 ) 2 + k 2 * ( x i 2 - x j 2 ) 2 + ... + k d * ( x i d - x j d ) 2 , d为特征总数。
本发明物联网标识编码划分方法流程如图1所示。物联网异构标识识别方法发明中使用三种规则来描述标识特征,这三种规则包括:长度规则、字节规则以及函数规则。长度规则是这类标识的规定长度,字节规则表示每一位的取值范围,函数规则是一些特殊的拓展规则,比如需要某个加密算法或者校验算法,通常这类规则在识别的过程中,是比较耗费时间的。当一个标识满足多个标准的规则要求时,这个标识就存在识别冲突。标识可能同时属于多个标准的情况是广泛存在的。
系统收录的是国内国外公开发布的标准800余项。标识本身特征数目有限,但是通过标识在标识识别系统(申请号:201410186428.X,“一种物联网异构标识识别方法和系统”)中的运行过程中提取出尽可能多的特征。
标识在标识识别系统中的初步提取的特征包括:是否包含字母,函数规则的个数,是否包含校验算法,标识在标识识别系统中运行时的匹配次数,标识的长度,通过长度筛选后的标准集合大小,函数规则的字节长度,最终的标准集合大小这8个特征。
将这8维向量作为一个编码标识的特征,运行聚类算法,迭代200次后停止。本发明使用了RSS(平方和比例)进行特征选择。
通过选择最具代表性的特征子集合,不仅能够减少聚类算法的处理时间,还能让模型对训练集之外的数据更有鲁棒性,因为选择了一个更简单的模型。
其中SSj,Between表示的是对于第j个特征,不同聚类之间的平方和,k表示的是第几个聚类,K表示的是聚类总数,事先给定为5,|Ck|表示第k个聚类有多少个样本,μj表示的是对于第j个特征,所有样本的均值,表示的是对于第j个特征,第k个聚类的均值。
对于第j个特征,所有5个簇内的样本平方和其中SSj,Within表示的是对于第j个特征,聚簇内样本的平方和,i表示第几个编码标识,n表示编码标识的总数,表示的是第i个编码标识属于聚类时,在特征j上的取值。
平方和比例: RSS j = 1 K - 1 SS j , B e t w e e n 1 n - K SS j , W i t h i n .
将每个特征的RSS从高到低排列,保留前5得到新的特征集合。
经过特征选择后,最终保留下标识在识别系统中运行时的匹配次数,标识的长度,通过长度筛选后可能的标准集合大小,函数规则的字节长度,最终的标准集合大小。这五个特征被认为是影响标识划分的重要因素。
标识在识别系统运行时的匹配次数T,直接关系到一个标识的识别速度。匹配次数越少,识别时间越短。对于实时性要求很高的物联网应用,这个指标至关重要。
标识的长度L,也是标识质量的重要因素。标识过长对于标识本身的传输有一定限制,此外对人来说也不容易记忆和理解。
通过长度筛选后的可能标准集合大小S,表示只经过长度校验,不需要其他的规则匹配这些耗费时间的操作,能够确定下来的标准集合。
函数规则的字节长度C,表示一个标识中那些复杂规则的字节长度。复杂规则的长度影响标识的识别效率以及人的可辨别程度。
最终的标准集合F,是标识经过识别系统以后获得的返回结果,可能是一个或多个标准。对于准确性要求很高的物联网应用,这个指标十分重要。
不同的物联网应用对上述五个特征的要求不同。本发明提出的是一种带权值的方法来综合考虑上述五个特征的划分方法。这些特征的内在联系很复杂,提出一个解析的方法准确的表示他们是比较困难的。但高质量的标识具备一些共同特征,同样低质量的标识也具备一些其他的相似特征。因此本发明使用带权值的聚类方法,将标识划分成A,B,C,D,E这五个等级,其中A类标识质量最高,E类标识质量最低。
不同的物联网应用中对上述的T,L,S,C,F这五个属性的要求不同,其权值分别为k1,k2,k3,k4,k5并且k1+k2+k3+k4+k5=1。出于综合各项因素的考虑,权值的设置不低于5%。k取值越大,这个特征对标识划分的影响越大。
权值选择方法:本发明对部分权重信息下多目标决策方法(参考徐泽水.部分权重信息下多目标决策方法研究[J].系统工程理论与实践,2002,22(1):43-47.)进行改进,通过使用关于权重k1,k2,k3,k4,k5和规范化矩阵R的线性函数作为目标函数,与下文中计算聚类得分的公式保持一致,同时利用了线性函数易于优化的特点,降低了计算的复杂度。
n的取值是输入编码的个数。
输入:n*d矩阵(d大小为5,n是样本的个数)k1,k2,k3,k4,k5(建议范围0.05≤k<1)
1.建立决策矩阵A=Rn*d
2.利用公式对A进行规范化得到矩阵R。R是规范化后的A矩阵,rij是规范后的i,j位置的取值,aij是原来矩阵A中i、j位置的值。
3.对于矩阵R的每一行,建立下列的单目标决策模型
min &Sigma; i = 1 d k i r i j s . t . 0.05 &le; k i < 1 , i = 1 , 2 , 3 , 4 , 5 &Sigma; i = 1 5 k i = 1
解此模型得到对应行j的最优目标权重向量
4上述k(j),j=1,...,n组成了新的矩阵W,计算(RTW)T(RTW)的最大特征值λmax及特征向量w。
5.对特征向量w进行归一化处理得到各个特征新的权值。
输出:特征权值k1,k2,k3,k4,k5
为了避免对度量单位选择的依赖性,特征应该归一化和标准化。常见的数据归一化方法有:最小-最大归一化、z分数归一化和按小数定标归一化。
标识的相异性可以用距离函数度量,这些度量包括欧几里得距离、曼哈顿距离和闵可夫斯基距离,在这些度量的分量上引入上述权值作为系数。
令i=(xi1,xi2,xi3,xi4,xi5)和j=(xj1,xj2,xj3,xj4,xj5)是两个编码标识的指标对象(经过归一化)。对象i和j之间的欧几里得距离定义为:
d ( i , j ) = k 1 * ( x i 1 - x j 1 ) 2 + k 2 * ( x i 2 - x j 2 ) 2 + k 3 * ( x i 3 - x j 3 ) 2 + k 4 ( x i 4 - x j 4 ) 2 + k 5 * ( x i 5 - x j 5 ) 2
对标识的划分采用聚类方法,旨在优化一个客观划分准则,如基于距离的相异性函数,使得根据这些标识的特征,在同一个簇中的对象是“相似的”,但是在不同的簇中的对象是“相异”的。经典的划分方法有k-means和k-centroids方法等。
聚类完成以后,本发明根据聚类结果进行额外计算,根据每个聚类中心的特征加权得到此聚类的得分。
聚类形成的新集合得分:W=k1*T+k2*L+k3*S+k4*C+k5*F。(T,L,S,C,F)是这五个质心的维度,将得分依次排列后,标记成A,B,C,D,E五种类别。
评价一个新产生的标识,经过标识识别系统识别以后得到(T,L,S,C,F)这五个维度的数据,计算(T,L,S,C,F)离上述五个质心的距离,分配到最近的那个质心所属的类别。
与现有技术相比,本发明的优点:
1)提取出标识划分的各项特征,能够在较高的准确度下,对异构物联网标识进行快速划分。
2)针对不同标识应用的特点,支持对标识特征优先级的人工配置。
附图说明
图1为本发明标识编码划分方法流程图。
具体实施方式
下面结合具体实施例对本发明进行进一步描述。
本发明选择<DL/T_700.3-1999>,<GB/T_14043-2005_3>,<GB/T_28532-2012>,<HY/T_075-2005>,<CID>,<GB/T_21381-2008_5>,<GA/T_556.10-2007>,<YC/T_393-2011_3>,<GA/T_396-2002_4>,<GA_658.3-2006>,<DL/T_700.2-1999_5>,<GA_398.1-2002>,<GB/T_16828-2007_3>,<GB/T_22483-2008>,<GB_18937-2003>,<SB/T_10570-2010>,<GA_658.9-2006>,<GB/T_26819-2011_3>,<GA_408.2-2006>,<PhoneNumber>等800余种标准,每项标准产生了1千个标识作为仿真数据,匹配次数和可行标准大小的这两个特征的权值均为0.4,长度筛选后的标准个数和标识长度这两项标准的权重为0.05,函数规则的长度这个特征的权重为0.1,即权重向量为(0.4,0.05,0.05,0.1,0.4)。聚类的数目选择为5。经过标识识别系统分析以后,得到每一个标识的这五个特征:匹配次数,标识长度,长度筛选后的集合,函数规则字节长度,可行标准集合。统计出每项标准的最大值和最小值,如表1所示。利用最小-最大规范化将训练集归一到[0,1]区间,方便进行聚类。
假设minA和maxA分别为属性A中的最小值和最大值。最小-最大规范化通过计算
v i &prime; = v i - min A max A - min A ( n e w _ max A - n e w _ min A ) + n e w _ min A
把A的值映射到区间[new_minA-new_minA]中的vi'。
标识之间的距离度量使用的是欧几里得距离。令i=(xi1,xi2,xi3,xi4,xi5)和j=(xj1,xj2,xj3,xj4,xj5)是两个标识的指标对象(经过最小-最大规范化)。对象i和j之间的欧几里得距离定义为:
d ( i , j ) = k 1 * ( x i 1 - x j 1 ) 2 + k 2 * ( x i 2 - x j 2 ) 2 + k 3 * ( x i 3 - x j 3 ) 2 + k 4 ( x i 4 - x j 4 ) 2 * ( x i 5 - x j 5 ) 2 .
算法:k-均值。用于划分的k-均值算法,其中每个簇的中心都用簇中所有对象的均值来表示。
输入:k:簇的数目D:包含n个对象的数据集,每个对象由5维向量组成。
输出:k个簇的集合
方法:
1)从D中任意选择k个对象作为初始簇中心;
2)Repeat
3)根据簇中对象的均值,将每个对象分配到最相近的簇;
4)更新簇的均值,即重新计算每个簇中对象的均值;
5)Until不再发生变化或者达到了指定的迭代次数。
k-均值的簇的数目是人为指定的,既要考虑到类别之间有较大的差异性,数目不能设置的太少,又要考虑到这个指标在现实中表达的方便和简介,数目不能设置的太多。本专利通过仿真数据综合比较选择5作为最终聚类的数目,并对其划分A,B,C,D,E五个等级,其中A是标识质量最高的种类。
表1各项指标的最大最小值
经过kmeans聚类算法训练以后得到下面的聚类中心。
表2五个评级的质心
计算每一个聚类的指数:W=k1*T+k2*L+k3*S+k4*C+k5*F
k=(k1,k2,k3,k4,k5)=(0.4,0.05,0.05,0.1,0.4)
指数分别为:0.32,0.27,0.45,0.42,0.23。指数越低,说明这个编码的质量越高,指数依次评级为C,B,E,D,A,如表2所示。
对于新的编码比如2101CN51R这个标识,经过标识识别系统识别以后,得到的5维特征(T,L,S,C,F)=(43,9,44,4,9)经过最小-最大规范化后,得到(0.24,0.26,0.18,0.29,0.09)。计算这个向量到上述五个质心的距离, d ( i , j ) = k 1 * ( x i 1 - x j 1 ) 2 + k 2 * ( x i 2 - x j 2 ) 2 + k 3 * ( x i 3 - x j 3 ) 2 + k 4 ( x i 4 - x j 4 ) 2 + k 5 * ( x i 5 - x j 5 ) 2 距离分别为0.19,0.12,0.34,0.40,0.17,距离表2中第二个类别最近,即B。因此这是一个B类标准。

Claims (7)

1.一种高效的物联网标识编码划分方法,其步骤为:
1)选取用于互联网标识编码划分的若干特征,并为每一特征设定一权值;
2)对所选特征进行归一化处理;
3)对选取的编码标识样本进行聚类,其中将上述权值作为所选聚类算法的度量函数中度量分量的系数;
4)对每个聚类中心的特征进行加权计算得到对应聚类的得分;
5)对于一待划分的编码标识,从该编码标识中提取与步骤1)相同的若干特征,然后计算与步骤4)每一聚类中心的相似性,将该待划分编码标识分配到最相似的类别中。
2.如权利要求1所述的方法,其特征在于,所述用于互联网标识编码划分的特征包括:标识在标识识别系统中运行时的匹配次数,标识的长度,通过长度筛选后的标准集合大小,函数规则的字节长度,最终的标准集合大小。
3.如权利要求1或2所述的方法,其特征在于,选取出所述用于互联网标识编码划分的特征的方法为:首先在标识识别系统中提取编码标识特征:是否包含字母,函数规则的个数,是否包含校验算法,标识在标识识别系统中运行时的匹配次数,标识的长度,通过长度筛选后的标准集合大小,函数规则的字节长度,最终的标准集合大小;然后对初步提取的编码标识特征进行聚类,确定出所述用于互联网标识编码划分的特征。
4.如权利要求3所述的方法,其特征在于,对初步提取的编码标识特征进行聚类,确定出所述用于互联网标识编码划分的特征的方法为:对于每一初步提取的编码标识特征进行聚类时,计算不同聚类之间的平方和以及聚类簇内的样本平方和其中SSj,Between表示对于第j个编码标识特征,不同聚类之间的平方和,K是设定的聚类总数,|Ck|表示第k个聚类的样本数,μj是对于第j个编码标识特征,所有样本的均值,是对于第j个编码标识特征,第k个聚类的均值;SSj,Within是对于第j个编码标识特征,聚簇内样本的平方和,n表示编码标识的总数,是第i个编码标识对应于第j个编码标识特征聚类时的取值;然后计算该编码标识特征对应的平方和比例最后根据平方和比例值选取出所述用于互联网标识编码划分的特征。
5.如权利要求1所述的方法,其特征在于,确定每一特征的权值的方法为:
1)建立一决策矩阵A=Rn*d;其中,d为特征总数,n为编码标识样本个数;
2)对矩阵A进行规范化得到一矩阵R;
3)对于矩阵R的每一行,建立一单目标决策模型;解此单目标决策模型得到对应行的最优目标权重向量;
4)将各行对应的最优目标权重向量组成一矩阵W,计算(RTW)T(RTW)的最大特征值λmax及特征向量w;
5)对特征向量w进行归一化处理得到各个特征的权值。
6.如权利要求5所述的方法,其特征在于,所述单目标决策模型为其中,0.05≤ki<1,i=1,2,...,d,
7.如权利要求1所述的方法,其特征在于,所述度量函数为欧几里得距离函数,计算两编码标识的距离 d ( i , j ) = k 1 * ( x i 1 - x j 1 ) 2 + k 2 * ( x i 2 - x j 2 ) 2 + .... + k d * ( x i d - x j d ) 2 , d为特征总数。
CN201510971553.6A 2015-12-22 2015-12-22 一种高效的物联网标识编码划分方法 Active CN105654112B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201510971553.6A CN105654112B (zh) 2015-12-22 2015-12-22 一种高效的物联网标识编码划分方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201510971553.6A CN105654112B (zh) 2015-12-22 2015-12-22 一种高效的物联网标识编码划分方法

Publications (2)

Publication Number Publication Date
CN105654112A true CN105654112A (zh) 2016-06-08
CN105654112B CN105654112B (zh) 2019-03-22

Family

ID=56477733

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201510971553.6A Active CN105654112B (zh) 2015-12-22 2015-12-22 一种高效的物联网标识编码划分方法

Country Status (1)

Country Link
CN (1) CN105654112B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400348A (zh) * 2020-03-25 2020-07-10 贵阳块数据城市建设有限公司 一种多种标识编码规则的异构数据处理方法

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102129470A (zh) * 2011-03-28 2011-07-20 中国科学技术大学 标签聚类方法和系统
US20120330957A1 (en) * 2007-05-30 2012-12-27 International Business Machines Corporation Information processing method for determining weight of each feature in subjective hierarchical clustering
CN103929499A (zh) * 2014-05-05 2014-07-16 中国科学院计算机网络信息中心 一种物联网异构标识识别方法和系统

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120330957A1 (en) * 2007-05-30 2012-12-27 International Business Machines Corporation Information processing method for determining weight of each feature in subjective hierarchical clustering
CN102129470A (zh) * 2011-03-28 2011-07-20 中国科学技术大学 标签聚类方法和系统
CN103929499A (zh) * 2014-05-05 2014-07-16 中国科学院计算机网络信息中心 一种物联网异构标识识别方法和系统

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111400348A (zh) * 2020-03-25 2020-07-10 贵阳块数据城市建设有限公司 一种多种标识编码规则的异构数据处理方法
CN111400348B (zh) * 2020-03-25 2023-08-08 贵阳块数据城市建设有限公司 一种多种标识编码规则的异构数据处理方法

Also Published As

Publication number Publication date
CN105654112B (zh) 2019-03-22

Similar Documents

Publication Publication Date Title
CN106845717B (zh) 一种基于多模型融合策略的能源效率评价方法
CN108846259B (zh) 一种基于聚类和随机森林算法的基因分类方法及系统
CN106709754A (zh) 一种用基于文本挖掘的电力用户分群方法
CN106991447A (zh) 一种嵌入式多类别属性标签动态特征选择算法
CN110826618A (zh) 一种基于随机森林的个人信用风险评估方法
CN107066555A (zh) 面向专业领域的在线主题检测方法
CN107832456B (zh) 一种基于临界值数据划分的并行knn文本分类方法
CN106446011B (zh) 数据处理的方法及装置
CN112348084B (zh) 改进k-means的未知协议数据帧分类方法
CN106067034A (zh) 一种基于高维矩阵特征根的配电网负荷曲线聚类方法
CN115048490B (zh) 一种基于深度学习的云制造服务流程推荐方法
CN118194067B (zh) 一种基于多维高斯混合模型的广告外溢检测方法
CN109754023A (zh) 基于j散度的新型决策树分类方法
CN111709460A (zh) 基于相关系数的互信息特征选择方法
CN103310027B (zh) 用于地图模板匹配的规则提取方法
CN107886130A (zh) 一种基于聚类和相似度加权的kNN快速分类方法
CN105654112A (zh) 一种高效的物联网标识编码划分方法
CN111488903A (zh) 基于特征权重的决策树特征选择方法
CN112164144A (zh) 一种结合d2算子和法向算子的铸件三维模型分类方法
CN111950652A (zh) 一种基于相似度的半监督学习数据分类算法
Mu Implementation of Music Genre Classifier Using KNN Algorithm
JP7411473B2 (ja) 妥当性確認方法、妥当性確認システム及びプログラム
CN108388911A (zh) 一种面向混合属性的移动用户动态模糊聚类方法
CN114429172A (zh) 基于变电站用户构成的负荷聚类方法、装置、设备及介质
CN103164499A (zh) 一种产品规划中的订单聚类方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant