CN113792110A - 一种基于社交物联网的设备信任值评估方法 - Google Patents
一种基于社交物联网的设备信任值评估方法 Download PDFInfo
- Publication number
- CN113792110A CN113792110A CN202110883965.XA CN202110883965A CN113792110A CN 113792110 A CN113792110 A CN 113792110A CN 202110883965 A CN202110883965 A CN 202110883965A CN 113792110 A CN113792110 A CN 113792110A
- Authority
- CN
- China
- Prior art keywords
- internet
- vector
- things
- matrix
- social
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/31—Indexing; Data structures therefor; Storage structures
- G06F16/316—Indexing structures
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F21/00—Security arrangements for protecting computers, components thereof, programs or data against unauthorised activity
- G06F21/50—Monitoring users, programs or devices to maintain the integrity of platforms, e.g. of processors, firmware or operating systems
- G06F21/57—Certifying or maintaining trusted computer platforms, e.g. secure boots or power-downs, version controls, system software checks, secure updates or assessing vulnerabilities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
Abstract
本发明涉及一种基于社交物联网的设备信任值评估方法,包括步骤:提取物联网设备之间的社交关系,使用邻接矩阵分别构建物联网设备社交关系的无向网络图;用图神经网络技术获取物联网设备社交关系的特征向量。本发明的有益效果是:本发明将神经网络的训练看作一个回归问题,并设计相应的损失函数,这个损失函数包含预测值准确度计算和惩罚项两部分,惩罚项可以防止模型训练中出现过拟合的现象;利用社会物联网中设备之间的多种社交关系,通过图神经网络技术和矩阵分解综合考虑物联网设备之间的社交关系和用户对设备的信任反馈信息,实现物联网设备信任值的精准评估,解决在社交物联网环境下,用户获取服务之前对不同服务进行信任评估的问题。
Description
技术领域
本发明属于物联网设备信任评估技术领域,尤其涉及一种基于社交物联网的设备信任值评估方法。
背景技术
物联网技术是将相当数量的智能设备,如智能手机、智能手表、传感器等,按照一定的方式连接起来,建立关系,实现共同目标。近年来,以社交网络为组织形式,实现可扩展的物联网设备服务开发和利用的社会化物联网,一经提出就迅速成为物联网领域的新热点,并立即受到业界和学界的高度关注。作为传统物理网络和社会网络的结合体,社会物联网利用物联网设备间的社会关系和上下文主客观因素,发现用户所需的设备服务,具有高效发现和情景感知的优势。
由于社交物联网在通信中涉及数据传输,在传输过程中存在被截取和利用的可能,传输数据的可靠性、稳定性和真实性将受到威胁,智能设备和日常用品可能成为安全隐患,因此社交物联网中设备的信任管理成为非常重要的部分。此外,由于智能设备提供商和提供服务的类型不同,一些服务设备与用户的互动不会太多,这就导致了数据稀疏的问题,引出了信任管理评估难题,即使如何有效利用稀疏数据提供的少量信息实现海量设备的信任评估。
发明内容
本发明的目的是克服现有技术中的不足,提供一种基于社交物联网的设备信任值评估方法。
这种基于社交物联网的设备信任值评估方法,包括以下步骤:
步骤1、设备之间应当存在某些联系,为了表征这些联系,综合考虑设备之间的关系,使用了相近位置、相同网段、相同用户以及协作工作在设备上的映射这四种设备之间的关系;提取物联网设备之间的社交关系,物联网设备社交关系包括相近位置、相同网段、协作工作和相同用户;基于提取的四种物联网设备社交关系,使用邻接矩阵分别构建四个物联网设备社交关系的无向网络图:
Gk=[v{i,j},k],v{i,j},k={0,1}.
上式中,Gk表示第k个无向网络图;k∈{1,2,3,4};v{i,j},k表示第k个无向网络图中的元素,当第i个物联网设备和第j个物联网设备有对应关系时,v{i,j},k取值为1,否则v{i,j},k取值为0;无向网络图的节点表示物联网设备,无向网络图的边表示物联网设备之间的关系,从而可以构建出四个无向网络图;
步骤2、在构建好的四种物联网设备社交关系的无向网络图中,用图神经网络技术获取物联网设备社交关系的特征向量,四种物联网设备社交关系的特征向量在结构上有相似性,表示物联网设备在某一个观察角度的特征,将特征向量按列连接,得到在选定的四个观察角度上的综合服务特征;特征向量的维数会影响得到综合服务特征的效果,而这是无法获取的一个信息,因此预定义多个特征维数来进行多重向量嵌入,根据对比实验调整特征向量的维数;
步骤3、基于用户对于物联网设备的历史评价获得信任值矩阵,信任值矩阵的行数m表示用户个数,列数n表示物联网设备个数;将信任值矩阵分别按照行和列分解成为能体现用户以及设备特征的两个低秩向量,使得两个低秩向量的乘积能够近似接近原始信任矩阵,根据多组对比实验确定低秩向量的维数,并且引入预测的偏置项;将用户低秩向量、物联网设备低秩向量和综合服务特征进行加权融合,得到设备的综合表示向量;
设置恰当的网络参数和损失函数进行训练,损失函数的设置包含优化项和惩罚项,既能够使得训练的优化方向是期望的方向,又能确保模型不发生过拟合现象;
步骤4、针对仅提供某一部分物联网设备的信任度的未知用户,进行关于物联网设备的信任预测;使用谷本系数(广义雅可比系数)计算未知用户与已知用户在历史评价方面的相似度:
上式中,X指未知用户对于设备的信任值向量,Y指已知用户对于设备的信任值向量,用来比较两个用户的相似度;谷本系数结合了余弦相似度和雅可比系数的特点,对于任何数据格式的序列都可以进行计算;雅可比系数计算符号度量或布尔值度量的个体间的相似度,谷本系数则可以避免这些限制而对任何数值都可以起作用,对于任何数据格式的序列都可以进行计算;根据相似度的排序,将与未知用户相似度最高的几个用户的矩阵索引输入神经网络模型得到预测信任值;然后对多个信任值依照相似度排序加权获得最终信任值,相似度越高,权值越高,得到的最终信任值为未知用户对物联网设备的信任预测值。
作为优选,步骤1物联网设备社交关系中:相近位置指两个物联网设备之间的距离小于所有物联网设备之间的平均距离,表示地理位置(经纬度)处于同一个大洲;相同网段指两个物联网设备IP地址的前24位相同,也就是处于同一个C类网络之下;相同用户指同一个用户使用过的物联网设备集合,一个用户会多次与不同设备进行交互,依据这些交互信息表示同一个用户的需求,从而会反映出被使用设备之间的相似性;协作工作指物联网设备拥有者之间是否相互熟识,这种关系映射到用户所拥有的设备之间,相互熟识的用户所拥有的设备之间会存在相识的关系。
作为优选,步骤2具体包括如下步骤:
步骤2.1、通过随机游走技术获取不同物联网设备间以无向网络图的节点为基本元素构成的相关关系(独热编码),设置阈值,游标在无向网络图的节点的之间按照无向网络图的边随机游动获取路径,当获取的路径长度达到阈值后,游标停止随机游动,由此获得的一条路径上的物联网设备应当在一些潜在方面有相关联系;
步骤2.2、随机游走技术随机选取初始点,规定路径长度,在网络图中随机漫游,获取的路径中的节点可以认为有一定的联系,也可以看作获取的是语句;使用随机游走技术获取的相关关系,将获取相关关系时的路径当作输入语句;然后用词嵌入技术的skip-gram模型来计算相关概率,获取表示无向网络图的节点(也就是设备特征)的特征向量;
步骤2.2.1、若单词对应无向网络图的节点di,语句对应无向网络图中随机游走技术的路径中的节点集合(d0,d1,…,dj),则随机游走技术的优化目标为Pr(dj|(d0,d1,…,dj-1)),但是需要每个无向网络图节点的数字表示;将无向网络图中的每个节点映射为一个向量:
步骤2.3、获得不同物联网设备的不同特征向量构成的矩阵和其中和分别对应位于相近位置的物联网设备社交关系、位于相同网段的物联网设备社交关系、属于相同用户的物联网设备社交关系和协作工作的物联网设备社交关系,n和t分别表示特征向量的行数和列数;四种矩阵在结构上有相似性,表示物联网设备在某一个观察角度的特征;
步骤2.4、将物联网设备的特征向量和表征物联网设备的低秩向量加权融合得到物联网设备的综合表征向量(即综合服务特征);将综合表征向量和用户的低秩向量再通过加权矩阵融合,作为神经网络模型的输入,加权矩阵融合的参数需要通过机器学习获取;向量融合的目的是获得一个新的数据体,在保持各自特性的同时,可以保留重要信息并过滤噪声,在这里用向量连接;完全保留了各自的属性特征,并将有效的信息提取放到后续的机器学习步骤中,从而提高准确率,在实践中是一种经过验证的方法;设置恰当的网络参数和损失函数对神经网络模型进行训练,损失函数的设置包含优化项和惩罚项,既能够使得训练的优化方向是期望的方向,又能确保模型不发生过拟合现象;将矩阵和按列连接,组成一个完整的向量矩阵S{n×r′}并输出,该完整的向量矩阵表示综合服务特征:
r′=4×t
上式中,r′为按列连接后的矩阵维数,t为按列连接前的矩阵维数综合服务特征的特征向量维数相对于不同特征向量构成的矩阵维数扩大了四倍。
作为优选,步骤2中对比实验的变量是图神经网络技术获取的嵌入向量维数,对比实验的对比指标为最终预测结果与真实结果的差距。
作为优选,嵌入向量维数是16。
作为优选,步骤2.1中随机游走技术是在无向网络图上反复随机选择一条游走的路径,最终形成一条穿越无向网络图的路径;随机游走技术从特定的端点开始,游走的每一步都随机选择无向网络图内与当前节点相连的一条边,沿着选定的边移动到下一个顶点,并重复这一过程;随机游走技术作为图嵌入技术的一种应用,要将无向网络图中的节点用低秩向量来表示。
作为优选,步骤2.2.2中skip-gram模型是自然语言处理中的嵌入技术,是在已知当前节点的情况下,预测与其相关的节点,包括输入层、投影层、输出层三层;输入层的输入为当前样本中心节点的节点向量,投影层是恒等映射,而输出层则是经过哈夫曼树进行目标优化再经过softmax后的概率。
作为优选,步骤3具体包括如下步骤:
步骤3.1、对信任值矩阵赋值初始化,用交叉验证将信任值矩阵划分为不同规模的测试集和训练集,同时对测试集和训练集进行不同规模的稀疏;
步骤3.1.1、假定输入的信任值矩阵为一个大规模矩阵T,大小为m*n,行数m代表已知用户的数量,列数n代表全部物联网设备的数量;目的是分别获取关于用户和物联网设备的低秩向量U和V,使得两个低秩向量的乘积能够近似于原矩阵:
T′=U×VT
上式中,用户的低秩向量U的行数为m,列数为r;物联网设备的低秩向量V的行数为n,列数为r,r是预定义的参数;VT表示V的转置矩阵;T′为预测矩阵;T为信任值矩阵;||·||F表示矩阵的F-范数;
步骤3.1.2、采用原信任值矩阵的行向量和列向量分别对用户的低秩向量U和物联网设备的低秩向量V进行初始化;确定向量U和向量V的向量维数;
步骤3.1.3、用交叉验证将信任值矩阵划分为测试集和训练集来进行交叉验证;为了展示算法的稳定性,对信任值矩阵做从10%到90%的不同程度的稀疏;
步骤3.2、对初始化之后的信任值矩阵进行组合,作为神经网络模型的输入,设置每层神经网络之间的连接方式、优化目标和损失函数,训练神经网络模型,直至达到设定次数后神经网络模型输出训练后的物联网设备的低秩向量,通过这种方式得到的两个低秩向量就可以通过对原始矩阵产生很好的拟合效果;神经网络模型采用多层非线性全连接层连接,每层非线性全连接层之间采用的激活函数为sigmoid函数;在训练次数达到设定次数后,输出用户低秩向量U和物联网设备低秩向量V,此时已经完成将原矩阵的行和列进行嵌入的任务;
步骤3.2.1、首先要设置权值矩阵,将用户低秩向量U和物联网设备低秩向量V、物联网设备的综合表征向量S进行加权融合,得到设备的综合表征向量;对于物联网设备低秩向量V和综合表征向量S中的第p行分别用vp和sp代替,均表示第p个设备的特征:
在模型训练之前,需要将信任矩阵低秩分解得到的向量以及图神经网络通过嵌入得到的特征向量融合输入,要通过恰当的权值矩阵将有关设备的低秩向量和特征向量加权融合;将得到的设备的综合表征向量和用户的低秩向量再通过加权矩阵融合作为神经网络模型的输入,使得可以保留重要信息并过滤噪声;融合的方式是通过权值矩阵进行加权求和,并加入偏移向量;将有关用户的向量U加入融合,U的第q行用uq代替,表示第q个用户的特征;
步骤3.2.2、设置具有多层非线性全连接层的神经网络模型,并设置网络参数和损失函数,对神经网络模型进行训练;神经网络模型选择前馈神经网络,需要训练各层之间的连接关系;损失函数采用一次误差、二次误差和惩罚项,防止过拟合现象的发生;将加权融合之后的特征映射到隐藏空间当中,这种非线性的转换可以提高预测的准确度,因此使用多层非线性转化来进行预测:
h=σLpq
上式中,σ表示sigmoid激活函数;Lpq表示加权求和后的权值矩阵,这种非线性的转换可以提高预测的准确度;使用多层非线性转化来预测各层非线性全连接层之间的联系:
hl=σ(Wl(l-1)hl-1+bl)
为了最优化神经网络全部参数,将这个问题看作一个回归问题,设计神经网络模型的损失函数为:
上式中,λ表示正则化参数,||·||F表示F-范数,θ表示神经网络模型参数集合;(i,j)表示第i个用户和第j个设备的序列对;J表示信任数据已知的全部序列对组成的集合;表示第i个用户对第j个设备的信任预测值;ri,i表示第i个用户对第j个设备的信任真实值;θ表示神经网络模型参数集合。
本发明的有益效果是:
本发明针对现有技术的不足,利用社会物联网中设备之间的多种社交关系,通过图神经网络技术和矩阵分解综合考虑物联网设备之间的社交关系和用户对设备的信任反馈信息,实现物联网设备信任值的精准评估,解决在社交物联网环境下,用户获取服务之前对不同服务进行信任评估的问题。
为了最优化神经网络全部参数,将神经网络的训练看作一个回归问题,并设计相应的损失函数,这个损失函数包含预测值准确度计算和惩罚项两部分,惩罚项可以防止模型训练中出现过拟合的现象。
附图说明
图1为本发明实施例中的预处理、训练、输出等步骤的流程图;
图2为本发明实施例中的基于图神经网络的特征提取流程图;
图3为本发明实施例中的基于神经网络的低秩向量分解流程图;
图4为本发明实施例中用户的索引输入模型训练流程图;
图5为本发明实施例中对单一用户多设备的信任预测流程图。
具体实施方式
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
实施例一
本申请实施例一提供了一种如图1所示基于社交物联网的设备信任值评估方法,提出了预处理、训练、输出等步骤的流程。实现步骤如下:
S1、基于相近位置、相同网段、相同用户以及用户之间社交关系在设备上的映射这四种设备之间的关系构建网络图,相近位置的概念为处于同一个大洲,相同网段的概念是IP地址的前24位相同,相同用户的概念是被同一个用户使用过的设备集合,用户之间的社交关系是指用户是否相互熟识,这种关系映射到用户所拥有的设备之间。确定下四种关系(位于相近位置的设备关系、位于相同网段的设备关系、相同用户的设备关系、用户之间社交关系)之后,构建四个无向网络图。
设备之间应当存在某些联系,为了表征这些联系,综合考虑设备之间的关系,使用了相近位置、相同网段、相同用户以及用户之间社交关系在设备上的映射这四种设备之间的关系。相近位置表示地理位置(经纬度)处于同一个大洲;相同网段的概念是设备所拥有的IP地址的前24位相同,也就是处于同一个C类网络之下;相同用户的概念是被同一个用户使用过的设备集合,一个用户会多次与不同设备进行交互,依据这些交互信息表示同一个用户的需求,从而会反映出被使用设备之间的相似性;用户之间的社交关系是指用户是否相互熟识,这种关系映射到用户所拥有的设备之间,相互熟识的用户所拥有的设备之间会存在相识的关系。这些关系均可使用邻接矩阵来表示,其中节点就是设备,边就是设备之间的关系,从而可以构建出四个无向网络图。
S2、在构建之后的四种无向网络图当中应用图神经网络技术分别获取关于设备的四种特征向量,向量维数的最佳选择根据相应对比实验进行调整。四种向量在结构上有相似性,表示设备在某一个观察角度的特征,将特征向量按列连接之后,得到的便是在选定的四个观察角度上的综合特征。效果通常会受到特征维数的影响,而这是无法获取的一个信息,为了克服这个困难,将预定义多个特征维数来支持多重向量嵌入。
首先通过随机游走获取不同设备的独热编码,会设置一个阈值,一个游标在节点之间按照边随机游动获取路径,当路径长度达到阈值后就会停止,由此获得的一条路径上的设备应当在一些潜在方面有相关联系;然后经过词嵌入技术的skip-gram模型,获得不同设备的不同特征向量构成的矩阵和其中t表示预定义的特征维数,n表示行数,接着将四个特征向量矩阵按列连接组成一个完整的向量矩阵并输出。
S3、将基于用户对于设备的历史评价获得的信任矩阵,矩阵的行数m表示用户个数,列数n表示设备个数,分别两个按照行和列分解成为能体现用户以及设备特征的低秩向量,使得两个向量的乘积能够近似接近原始矩阵。
矩阵低秩分解的目的是将规模较大的矩阵近似成为两个低秩向量的乘积,从而进行矩阵补全等目的,传统的分解方法有奇异值分解等。在本步骤当中,假定输入的信任值矩阵为一个大规模矩阵T,大小为m*n,行数m代表已知用户的数量,列数n代表全部设备的数量。目的是获取分别关于用户和设备的低秩向量U和V,使得两个低秩向量的乘积能够近似于原矩阵:
T′=U×VT
其中U的行数为m,列数为r,V的行数为n,列数为r,VT表示V的转置矩阵,r是预定义的参数,T′为预测矩阵,||·||F表示矩阵的F-范数。
为了更准确地达到目的,放弃采用传统的方法,而是引入神经网络的方法,将这个问题看作一个回归问题。首先对两个向量初始化,这里分别取矩阵的行和列作为U和V的初始值,通过多层非线性全连接层进行训练;最后输出训练之后地向量。通过这种方式得到的两个低秩向量U和V就可以通过T′=U×VT对T产生很好的拟合效果。
S4、将图神经网络处理得到的关于设备的特征向量与信任矩阵分解得到的有关用户和设备不同表征的低秩向量进行处理,将特征向量和表征设备的低秩向量加权融合得到设备的综合表示向量。将得到的设备的综合表征向量和用户的低秩向量再通过加权矩阵融合作为神经网络的输入,使得可以保留重要信息并过滤噪声,设置恰当的网络参数和损失函数进行训练,损失函数的设置包含优化项和惩罚项,既能够使得训练的优化方向是期望的方向,又能确保模型不发生过拟合现象。
在神经网络模型训练之前,需要将信任矩阵低秩分解得到的向量以及图神经网络通过嵌入得到的特征向量融合输入,要通过恰当的权值矩阵将有关设备的低秩向量和特征向量加权融合。
将加权融合之后的特征向量通过非线性转换映射到隐藏空间当中,这种非线性的转换可以提高预测的准确度,因此使用多层非线性转化来进行预测。
为了最优化神经网络全部参数,将这个问题看作一个回归问题,并设计相应的损失函数,这个损失函数包含预测值准确度计算和惩罚项两部分,惩罚项可以防止模型训练中出现过拟合的现象。
S5、针对一位未知用户,首先使用谷本系数计算与已知用户在历史评价方面的相似度,谷本系数结合了余弦相似度和雅可比系数的特点,对于任何数据格式的序列都可以进行计算,根据相似度的排序,将相似度最高的几个用户的索引输入模型得到预测结果,然后对多个结果依照相似度排序加权获得最终结果,相似度越高,权值越高。
对于一位新的用户,仅仅知道他对某一部分设备的信任度,对他进行关于设备的信任预测。首先需要计算与已知用户的相似度,在这里使用谷本系数,也称广义雅可比系数。谷本系数结合了余弦相似度和雅可比系数的优点。雅可比系数计算符号度量或布尔值度量的个体间的相似度,谷本系数则可以避免这些限制而对任何数值都可以起作用。然后对与新用户相似度最高的几个用户进行预测,将用户的索引输入训练好的模型当中,输出的信任值进行加权,得到新用户对设备的信任预测值。
实施例二
在实施例一的基础上,如图2所示,本申请实施例二提供了步骤S2中基于图神经网络的特征提取的流程:
S201、基于相近位置、相同网段、相同用户以及用户之间社交关系在设备上的映射这四种设备之间的关系构建网络图,相近位置的概念为处于同一个大洲,相同网段的概念是IP地址的前24位相同,相同用户的概念是被同一个用户使用过的设备集合,用户之间的社交关系是指用户是否相互熟识,这种关系映射到用户所拥有的设备之间。确定下四种关系之后,构建四个无向网络图。
设备之间应当存在某些联系,为了表征这些联系,综合考虑设备之间的关系,使用了相近位置、相同网段、相同用户以及用户之间社交关系在设备上的映射这四种设备之间的关系。相近位置表示地理位置(经纬度)处于同一个大洲;相同网段的概念是设备所拥有的IP地址的前24位相同,也就是处于同一个C类网络之下;相同用户的概念是被同一个用户使用过的设备集合,一个用户会多次与不同设备进行交互,依据这些交互信息表示同一个用户的需求,从而会反映出被使用设备之间的相似性;用户之间的社交关系是指用户是否相互熟识,这种关系映射到用户所拥有的设备之间,相互熟识的用户所拥有的设备之间会存在相识的关系。这些关系均可使用邻接矩阵来表示,其中节点就是设备,边就是设备之间的关系,从而可以构建出四个无向网络图。
S202、在网络图中使用随机游走获取以节点为基本元素构成的相关关系,随机游走是在网络上反复随机选择一条游走的路径,最终形成一条穿越网络的路径。从一个特定的端点开始,行走的每一步都随机选择与当前节点相连的一条边,沿着选定的边移动到下一个顶点,并重复这一过程。作为图嵌入技术的一种应用,要将网络图中节点用低秩向量来表示。随机游走技术随机选取初始点,规定路径长度,在网络图中随机漫游,获取的路径中的节点可以认为有一定的联系,也可以看作获取的是语句。
S203、使用随机游走技术获取的相关关系,将路径当作语句输入,使用skip-gram计算相关概率,获取表示节点也就是设备特征的特征向量,特征向量的维数经过多次对比实验得出。
如果单词对应于网络中的节点di,句子序列对应于网络中的随机游走,则随机游走(d0,d1,…,dj)的优化目标为Pr(dj|(d0,d1,…,dj-1)),但是需要每个节点的数字表示,将网络中的每个节点映射为一个向量。
接下来,可以在自然语言处理中使用skip-gram模型,利用缺失节点和忽略节点存在的顺序来预测上下文节点的概率。所以优化的目标是
skip-gram是自然语言处理中的嵌入技术,是在已知当前节点的情况下,预测与其相关的节点,包括输入层、投影层、输出层三层。输入层的输入为当前样本中心节点的节点向量,投影层的功能只是个恒等映射,而输出层则是经过哈夫曼树进行目标优化后再经过softmax后的概率。
S204、多向量融合的方法有很多种,包括加权融合,而相应的一些参数需要通过机器学习获取。向量融合的目的是获得一个新的数据体,在保持各自特性的同时,放大有效信息,降低噪声的影响。在这里用向量连接。虽然这种方法形式简单,理解起来也不复杂,但它完全保留了各自的属性特征,并将有效的信息提取放到后续的机器学习步骤中,从而提高准确率,在实践中是一种经过验证的方法。将在四种网络图中获取的表征不同设备的特征向量按列进行连接,四种向量在结构上有相似性,表示设备在某一个观察角度的特征,将特征向量按列连接之后,得到的便是在选定的四个观察角度上的综合特征。特征维数扩大四倍,得到新的特征向量。
实施例三
在实施例一和实施例二的基础上,如图3所示,本申请实施例三提供了步骤S3中基于神经网络的低秩向量分解流程;
S301、对矩阵赋值初始化,之后对信任值矩阵应用交叉验证划分为不同规模的测试集和训练集,同时对数据集进行不同规模的稀疏。
采用原矩阵的行向量和列向量分别对U和V进行初始化,确定r即向量维数的取值。该步骤输入的信任值矩阵会被划分为训练集和测试集来进行交叉验证,并且为了展示算法的稳定性,对信任矩阵做了从10%到90%的不同程度的稀疏。
S302、对初始化之后的低秩矩阵进行相应的组合来作为神经网络的输入,设置每层神经网络之间的连接方式,优化目标和损失函数,训练达到一定轮次之后输出。
采用多个非线性层连接,每层之间采用的激活函数为sigmoid函数。在训练规定轮次后,输出两组低秩向量U和V,此时已经完成将原矩阵的行和列进行嵌入的任务。
实施例四
在实施例一至实施例三的基础上,如图4所示,本申请实施例三提供了步骤S4中神经网络模型训练的流程;
S401、将信任矩阵低秩分解得到的向量U和V以及图神经网络通过嵌入得到的特征向量S进行融合,保留重要信息并消除噪声的影响,融合结果作为模型训练的输入,融合的方式是通过权值矩阵进行加权求和,并加入偏移向量。
在模型训练之前,还需要将信任矩阵低秩分解得到的向量以及图神经网络通过嵌入得到的特征向量进行融合。首先要设置权值矩阵将有关设备的低秩向量V和特征向量S加权融合。对于V和S中的第p行分别用vp和sp代替,表示第p个设备的特征,如下式所示,
接着,将有关用户的向量U加入融合,U的第q行用uq代替,表示第q个用户的特征,如下式所示,
S402、设置多层非线性神经网络并设置恰当的网络参数和损失函数来进行训练。神经网络选择前馈神经网络,需要训练各层之间的连接关系。损失函数则包括优化目标也就是一次和二次误差、惩罚项用来防止过拟合现象的发生。
将加权融合之后的特征映射到隐藏空间当中,如下式所示:
h=σLpq
其中σ表示sigmoid激活函数。
这种非线性的转换可以提高预测的准确度,因此使用多层非线性转化来进行预测,下式展示了各层之间的联系:
hl=σ(Vl(l-1)hl-1+bl)
为了最优化神经网络全部参数,将这个问题看作一个回归问题,并设计损失函数为
这个损失函数包含预测值准确度计算和惩罚项两部分,惩罚项可以防止模型训练中出现过拟合的现象,λ表示正则化参数,||·||F表示F-范数,θ表示神经网络参数集合。
采用这个损失函数有以下考虑:
a)抛物线是一种自然现象,存在于自然界和日常生活中。将标准抛物线的表达格式ax2+bx+c运用到损失函数中,采用启发式的思路有可能产生很好的效果。因为当自变量x=0时,损失函数也应该为0,这意味着预测值与真实值完全相等。因此,c应该为0,表达式围绕纵轴对称,那么可以写成ax2+b|x|。
b)虽然L1损失,在求解过程中比较稳定,但如果预测值与真实值偏差太大,小梯度就需要较长时间才能达到收敛。但L2损失,即损失函数中的第一项,在预测值和真实值之间存在较大差异时,梯度值较大。两者的结合可以提高L1损失的灵敏度。
c)L2损失可以看作是两个向量之间的欧氏距离。L1损失也可以看作是两个向量之间的曼哈顿距离。欧氏距离在高维度上不是一个更好的度量,但曼哈顿距离在高维度空间中运行良好,因此可以弥补这一不足。
d)但L1损失有一个明显的缺点:它不能在零点推导。因此,使用log cosh函数,它
从以上方程可以看出,当误差较大时,该函数与L1损失只相差一个常数项,而当误差较小时,该函数可以近似于L2损失,并且是二阶可分的,所以该函数是替代L1损失的可行方法。
实施例五
在实施例一至实施例四的基础上,如图5所示,本申请实施例三提供了步骤S5中单一用户多设备的信任预测的流程;
S501、针对一位未知用户,仅仅知道他对某一部分设备的信任度,使用谷本系数计算与已知用户在历史评价方面的相似度,谷本系数结合了余弦相似度和雅可比系数的特点,对于任何数据格式的序列都可以进行计算。
对于一位新的用户,仅仅知道他对某一部分设备的信任度,对他进行关于设备的信任预测。首先需要计算与已知用户的相似度,在这里使用谷本系数,也称广义雅可比系数,如下式所示,
谷本系数结合了余弦相似度和雅可比系数的优点。雅可比系数计算符号度量或布尔值度量的个体间的相似度,谷本系数则可以避免这些限制而对任何数值都可以起作用。
S502、根据相似度的由高到低排序,对相似度最高的几个用户进行预测,将用户索引输入模型当中,对预测结果进行加权处理,相似度越高,权值越高。
根据S501中的计算结果,对与新用户相似度最高的几个用户进行预测,将用户的索引输入训练好的模型当中,输出的信任值进行加权,权值应与相似度相关,得到新用户对设备的信任预测值。
实验结果
需要说明的是,本组实验采用的数据集为github上的开源数据集,地址为https://github.com/wsdream/wsdream-dataset。所比较的参数有两个,分别是平均绝对误差(MAE)、均方根误差(RMSE)和一致序列对比率评分(FCP)。
如下表1、表2和表3所示,在实施例一至实施例五中,分别展示了本发明的方法与经典用于推荐预测方法和社交物联网中信任管理方法比较的平均绝对误差、均方根误差以及一致序列对比率评分。这几种方法分别为奇异值分解(svd),经典协同过滤推荐算法(slopeone),非负矩阵分解(nmf),ctst(参考文献:Lin Z,Dong L.Clarifying trust insocial internet of things[J].IEEE Transactions on Knowledge and DataEngineering,2017,30(2):234248.),mfm(参考文献:Aalibagi S,Mahyar H,Movaghar A,et a1.A Matrix Factorization Model for Hellinger-based Trust Management inSocial Internet of Things[J].IEEE Transactions on Dependable and SecureComputing,2021.),tgsm(参考文策:Farahbakhsh B,Fanian A,Manshaei M H.TGSM:Towards trustworthy group-based service management for social IoT[J].Internetof Things,2021,13:100312.)以及本发明的方法(mymethod)。
表1本发明与其他方法对比的MAE表
表2本发明与其他方法对比的RMSE表
表3本发明与其他方法对比的RMSE表
上表1和上表2显示了本发明实施例一至实施例五的方法和对比方法在MAE和RMSE上的数值,该数值越小,代表预测结果与真实数据越接近,从表格内容可以看出,实施例一至实施例五的方法在各种稀疏度下均优于其他对比方法。上表3显示了实施例一至实施例五的方法和对比方法在FCP上的数值,该数值越接近于1,表示预测结果在序列一致度上越接近于真实数据,本发明实施例一至实施例五的方法在各种稀疏度下均优于其他对比方法。
Claims (8)
1.一种基于社交物联网的设备信任值评估方法,其特征在于,包括以下步骤:
步骤1、提取物联网设备之间的社交关系,物联网设备社交关系包括相近位置、相同网段、协作工作和相同用户;基于提取的物联网设备社交关系,使用邻接矩阵分别构建物联网设备社交关系的无向网络图:
Gk=]v{i,j},k],v{i,j},k={0,1}.
上式中,Gk表示第k个无向网络图;k∈{1,2,3,4};v{i,j},k表示第k个无向网络图中的元素,当第i个物联网设备和第j个物联网设备有对应关系时,v{i,j},k取值为1,否则v{i,j},k取值为0;无向网络图的节点表示物联网设备,无向网络图的边表示物联网设备之间的关系;
步骤2、在构建好的物联网设备社交关系的无向网络图中,用图神经网络技术获取物联网设备社交关系的特征向量,物联网设备社交关系的特征向量表示物联网设备在某一个观察角度的特征,将特征向量按列连接,得到在选定的观察角度上的综合服务特征;预定义多个特征维数来进行多重向量嵌入,根据对比实验调整特征向量的维数;
步骤3、基于用户对于物联网设备的历史评价获得信任值矩阵,信任值矩阵的行数m表示用户个数,列数n表示物联网设备个数;将信任值矩阵分别按照行和列分解成两个低秩向量,引入预测的偏置项;将用户低秩向量、物联网设备低秩向量和综合服务特征进行加权融合,得到设备的综合表示向量;
步骤4、针对仅提供某一部分物联网设备的信任度的未知用户,进行关于物联网设备的信任预测;使用谷本系数计算未知用户与已知用户在历史评价方面的相似度:
上式中,X指未知用户对于设备的信任值向量,Y指已知用户对于设备的信任值向量;根据相似度的排序,将与未知用户相似度最高的几个用户的矩阵索引输入神经网络模型得到预测信任值;然后对多个信任值依照相似度排序加权获得最终信任值,得到的最终信任值为未知用户对物联网设备的信任预测值。
2.根据权利要求1所述基于社交物联网的设备信任值评估方法,其特征在于,步骤1物联网设备社交关系中:相近位置指两个物联网设备之间的距离小于所有物联网设备之间的平均距离;相同网段指两个物联网设备IP地址的前24位相同;相同用户指同一个用户使用过的物联网设备集合;协作工作指物联网设备拥有者之间是否相互熟识。
3.根据权利要求1所述基于社交物联网的设备信任值评估方法,其特征在于,步骤2具体包括如下步骤:
步骤2.1、通过随机游走技术获取不同物联网设备间以无向网络图的节点为基本元素构成的相关关系,设置阈值,游标在无向网络图的节点的之间按照无向网络图的边随机游动获取路径,当获取的路径长度达到阈值后,游标停止随机游动;
步骤2.2、使用随机游走技术获取的相关关系,将获取相关关系时的路径当作输入语句;然后用词嵌入技术的skip-gram模型来计算相关概率,获取表示无向网络图的节点的特征向量;
步骤2.2.1、若单词对应无向网络图的节点di,语句对应无向网络图中随机游走技术的路径中的节点集合(d0,d1,…,dj),则随机游走技术的优化目标为Pr(dj|(d0,d1,…,dj-1));将无向网络图中的每个节点映射为一个向量:
步骤2.3、获得不同物联网设备的不同特征向量构成的矩阵和其中和分别对应位于相近位置的物联网设备社交关系、位于相同网段的物联网设备社交关系、属于相同用户的物联网设备社交关系和协作工作的物联网设备社交关系,n和t分别表示特征向量的行数和列数;
步骤2.4、将物联网设备的特征向量和表征物联网设备的低秩向量加权融合得到物联网设备的综合表征向量;将综合表征向量和用户的低秩向量再通过加权矩阵融合,作为神经网络模型的输入;设置网络参数和损失函数对神经网络模型进行训练,损失函数的设置包含优化项和惩罚项;将矩阵和按列连接,组成完整的向量矩阵S{n×r′}并输出,该完整的向量矩阵表示综合服务特征:
r′=4×t
上式中,r′为按列连接后的矩阵维数,t为按列连接前的矩阵维数。
4.根据权利要求1所述基于社交物联网的设备信任值评估方法,其特征在于:步骤2中对比实验的变量是图神经网络技术获取的嵌入向量维数,对比实验的对比指标为最终预测结果与真实结果的差距。
5.根据权利要求4所述基于社交物联网的设备信任值评估方法,其特征在于:嵌入向量维数是16。
6.根据权利要求3所述基于社交物联网的设备信任值评估方法,其特征在于:步骤2.1中随机游走技术是在无向网络图上反复随机选择一条游走的路径,最终形成一条穿越无向网络图的路径;随机游走技术从特定的端点开始,游走的每一步都随机选择无向网络图内与当前节点相连的一条边,沿着选定的边移动到下一个顶点,并重复这一过程;随机游走技术将无向网络图中的节点用低秩向量来表示。
7.根据权利要求3所述基于社交物联网的设备信任值评估方法,其特征在于:步骤2.2.2中skip-gram模型包括输入层、投影层、输出层三层;输入层的输入为当前样本中心节点的节点向量,投影层是恒等映射,而输出层则是经过哈夫曼树进行目标优化再经过softmax后的概率。
8.根据权利要求1或3所述基于社交物联网的设备信任值评估方法,其特征在于,步骤3具体包括如下步骤:
步骤3.1、对信任值矩阵赋值初始化,用交叉验证将信任值矩阵划分为测试集和训练集,同时对测试集和训练集进行稀疏;
步骤3.1.1、假定输入的信任值矩阵为矩阵T,大小为m*n,行数m代表已知用户的数量,列数n代表全部物联网设备的数量;分别获取关于用户和物联网设备的低秩向量U和V:
T′=U×VT
上式中,用户的低秩向量U的行数为m,列数为r;物联网设备的低秩向量V的行数为n,列数为r,r是预定义的参数;VT表示V的转置矩阵;T′为预测矩阵;T为信任值矩阵;‖·‖F表示矩阵的F-范数;
步骤3.1.2、采用原信任值矩阵的行向量和列向量分别对用户的低秩向量U和物联网设备的低秩向量V进行初始化;确定向量U和向量V的向量维数;
步骤3.1.3、用交叉验证将信任值矩阵划分为测试集和训练集来进行交叉验证;对信任值矩阵做从10%到90%的不同程度的稀疏;
步骤3.2、对初始化之后的信任值矩阵进行组合,作为神经网络模型的输入,设置每层神经网络之间的连接方式、优化目标和损失函数,训练神经网络模型,直至达到设定次数后神经网络模型输出训练后的物联网设备的低秩向量;神经网络模型采用多层非线性全连接层连接,每层非线性全连接层之间采用的激活函数为sigmoid函数;在训练次数达到设定次数后,输出用户低秩向量U和物联网设备低秩向量V;
步骤3.2.1、首先要设置权值矩阵,将用户低秩向量U和物联网设备低秩向量V、物联网设备的综合表征向量S进行加权融合,得到设备的综合表征向量;对于物联网设备低秩向量V和综合表征向量S中的第p行分别用vp和sp代替,均表示第p个设备的特征:
将得到的设备的综合表征向量和用户的低秩向量再通过加权矩阵融合作为神经网络模型的输入;融合的方式是通过权值矩阵进行加权求和,并加入偏移向量;将有关用户的向量U加入融合,U的第q行用uq代替,表示第q个用户的特征;
步骤3.2.2、设置具有多层非线性全连接层的神经网络模型,并设置网络参数和损失函数,对神经网络模型进行训练;神经网络模型选择前馈神经网络;损失函数采用一次误差、二次误差和惩罚项;将加权融合之后的特征映射到隐藏空间当中:
h=σLpq
上式中,σ表示sigmoid激活函数;Lpq表示加权求和后的权值矩阵;使用多层非线性转化来预测各层非线性全连接层之间的联系:
hl=σ(Wl(l-1)hl-1+bl)
设计神经网络模型的损失函数为:
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110883965.XA CN113792110A (zh) | 2021-08-03 | 2021-08-03 | 一种基于社交物联网的设备信任值评估方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110883965.XA CN113792110A (zh) | 2021-08-03 | 2021-08-03 | 一种基于社交物联网的设备信任值评估方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN113792110A true CN113792110A (zh) | 2021-12-14 |
Family
ID=79181315
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110883965.XA Withdrawn CN113792110A (zh) | 2021-08-03 | 2021-08-03 | 一种基于社交物联网的设备信任值评估方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN113792110A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116541436A (zh) * | 2023-04-13 | 2023-08-04 | 华院计算技术(上海)股份有限公司 | 用于连铸生产线的相关性查询方法及装置、介质、终端 |
CN117077206A (zh) * | 2023-08-31 | 2023-11-17 | 广东省第二人民医院(广东省卫生应急医院) | 基于数字医疗下的患者信息安全控制方法及装置 |
-
2021
- 2021-08-03 CN CN202110883965.XA patent/CN113792110A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116541436A (zh) * | 2023-04-13 | 2023-08-04 | 华院计算技术(上海)股份有限公司 | 用于连铸生产线的相关性查询方法及装置、介质、终端 |
CN116541436B (zh) * | 2023-04-13 | 2024-02-27 | 华院计算技术(上海)股份有限公司 | 用于连铸生产线的相关性查询方法及装置、介质、终端 |
CN117077206A (zh) * | 2023-08-31 | 2023-11-17 | 广东省第二人民医院(广东省卫生应急医院) | 基于数字医疗下的患者信息安全控制方法及装置 |
CN117077206B (zh) * | 2023-08-31 | 2024-03-08 | 广东省第二人民医院(广东省卫生应急医院) | 基于数字医疗下的患者信息安全控制方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111428147B (zh) | 结合社交和兴趣信息的异源图卷积网络的社交推荐方法 | |
CN111061856B (zh) | 一种基于知识感知的新闻推荐方法 | |
Cao et al. | Class-specific soft voting based multiple extreme learning machines ensemble | |
Bickel et al. | A nonparametric view of network models and Newman–Girvan and other modularities | |
CN111737535B (zh) | 一种基于元结构和图神经网络的网络表征学习方法 | |
CN113190688B (zh) | 基于逻辑推理和图卷积的复杂网络链接预测方法及系统 | |
CN113792110A (zh) | 一种基于社交物联网的设备信任值评估方法 | |
Wang et al. | Graph neural networks: Self-supervised learning | |
CN110222838B (zh) | 文档排序方法、装置、电子设备及存储介质 | |
CN114358657B (zh) | 一种基于模型融合的岗位推荐方法及装置 | |
CN113486190A (zh) | 一种融合实体图像信息和实体类别信息的多模态知识表示方法 | |
CN112131261B (zh) | 基于社区网络的社区查询方法、装置和计算机设备 | |
CN113326377A (zh) | 一种基于企业关联关系的人名消歧方法及系统 | |
CN113628059A (zh) | 一种基于多层图注意力网络的关联用户识别方法及装置 | |
CN113822315A (zh) | 属性图的处理方法、装置、电子设备及可读存储介质 | |
CN112311608A (zh) | 一种多层异质网络空间节点表征方法 | |
CN113409157B (zh) | 一种跨社交网络用户对齐方法以及装置 | |
CN116701734B (zh) | 地址文本的处理方法、设备及计算机可读存储介质 | |
CN107798331B (zh) | 离变焦图像序列特征提取方法和装置 | |
Cortés et al. | A deep neural network architecture to estimate node assignment costs for the graph edit distance | |
CN111597401A (zh) | 基于图关系网络的数据处理方法、装置、设备及介质 | |
CN115601745A (zh) | 一种面向应用端的多视图三维物体识别方法 | |
CN111459990B (zh) | 对象处理方法、系统及计算机可读存储介质和计算机设备 | |
CN114462707A (zh) | 一种基于特征深度融合的Web服务多维QoS联合预测方法 | |
CN113378075A (zh) | 一种自适应融合网络拓扑和节点内容的社团发现方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20211214 |
|
WW01 | Invention patent application withdrawn after publication |