CN114817715A - 一种隐私保护的物联网实体服务搜索方法 - Google Patents
一种隐私保护的物联网实体服务搜索方法 Download PDFInfo
- Publication number
- CN114817715A CN114817715A CN202210414586.0A CN202210414586A CN114817715A CN 114817715 A CN114817715 A CN 114817715A CN 202210414586 A CN202210414586 A CN 202210414586A CN 114817715 A CN114817715 A CN 114817715A
- Authority
- CN
- China
- Prior art keywords
- search
- user
- internet
- things
- service
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Withdrawn
Links
- 238000000034 method Methods 0.000 title claims abstract description 29
- 239000013604 expression vector Substances 0.000 claims abstract description 26
- 238000012549 training Methods 0.000 claims description 36
- 230000006870 function Effects 0.000 claims description 22
- 239000013598 vector Substances 0.000 claims description 22
- 238000001914 filtration Methods 0.000 claims description 21
- 239000011159 matrix material Substances 0.000 claims description 21
- 238000013528 artificial neural network Methods 0.000 claims description 9
- 238000005065 mining Methods 0.000 claims description 7
- 230000004931 aggregating effect Effects 0.000 claims description 6
- 238000006243 chemical reaction Methods 0.000 claims description 6
- 238000012360 testing method Methods 0.000 claims description 6
- 238000010586 diagram Methods 0.000 claims description 4
- 238000004422 calculation algorithm Methods 0.000 claims description 3
- 238000004364 calculation method Methods 0.000 claims description 3
- 230000006835 compression Effects 0.000 claims description 3
- 238000007906 compression Methods 0.000 claims description 3
- 230000008878 coupling Effects 0.000 claims description 3
- 238000010168 coupling process Methods 0.000 claims description 3
- 238000005859 coupling reaction Methods 0.000 claims description 3
- 238000000605 extraction Methods 0.000 claims description 3
- 238000003064 k means clustering Methods 0.000 claims description 3
- 238000007781 pre-processing Methods 0.000 claims description 3
- 230000004927 fusion Effects 0.000 abstract description 3
- 230000009286 beneficial effect Effects 0.000 abstract description 2
- 238000012163 sequencing technique Methods 0.000 abstract description 2
- 230000006399 behavior Effects 0.000 description 4
- 238000011160 research Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000011161 development Methods 0.000 description 2
- 238000007619 statistical method Methods 0.000 description 2
- 238000007476 Maximum Likelihood Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000009977 dual effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000007613 environmental effect Effects 0.000 description 1
- 238000004880 explosion Methods 0.000 description 1
- 238000013467 fragmentation Methods 0.000 description 1
- 238000006062 fragmentation reaction Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 230000002452 interceptive effect Effects 0.000 description 1
- 238000012806 monitoring device Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 230000008569 process Effects 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9535—Search customisation based on user profiles and personalisation
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
- G06F18/232—Non-hierarchical techniques
- G06F18/2321—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions
- G06F18/23213—Non-hierarchical techniques using statistics or function optimisation, e.g. modelling of probability density functions with fixed number of clusters, e.g. K-means clustering
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
- G06F40/295—Named entity recognition
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/12—Protocols specially adapted for proprietary or special-purpose networking environments, e.g. medical networks, sensor networks, networks in vehicles or remote metering networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Health & Medical Sciences (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Computational Linguistics (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Computation (AREA)
- Life Sciences & Earth Sciences (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Computational Biology (AREA)
- Probability & Statistics with Applications (AREA)
- Computing Systems (AREA)
- Medical Informatics (AREA)
- Computer Networks & Wireless Communication (AREA)
- Signal Processing (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种隐私保护的物联网实体服务搜索方法,包括:利用物联网实体服务提供者的多源异构信息,通过表征学习得到物联网实体服务的表示向量;建立物联网实体服务的数据图表示模型;建立个性化搜索排序模型;向用户提供候选的实体服务搜索排序列表;获取隐私保护的个性化搜索结果。本发明的有益效果是:本发明建立了异构物联网实体服务的关联融合图,并对用户搜索意图深度挖掘,实现面向物联网实体服务因人而异的优质搜索结果,提升了用户服务满意度。
Description
技术领域
本发明涉及物联网搜索领域,更确切地说,它涉及一种隐私保护的物联网实体服务搜索方法。
背景技术
传感器、无线通信和普适计算等技术的迅速发展和普及使得大量具有感知、计算以及通信功能的物理实体对象广泛存在于物联网中。全世界的交通工具、环境监测装置、可穿戴设备、智能家居中的各种日常生活用品等都是物理实体对象,人和物的所有行为都可以被各种物理实体对象所感知。可以预见,正如目前我们利用网络搜索引擎查找互联网信息一样,随着各种应用领域(如环境监测、智能家居、智能物流和智能建筑工地等)对物理实体对象所提供的服务供应需求的日益增长,很快人们将在物联网环境下搜索各种物联网实体服务,这从近年来物联网、无线传感网络和移动计算等领域的研究工作中都能反映出来。在当今信息爆炸的时代,怎样使得满足用户搜索意图的物联网实体服务被检索出来成为技术与商业应用的双重挑战。
另一方面,物联网实体服务搜索可能返回多个与用户请求匹配的结果,还需要根据用户兴趣偏好和上下文情景从中选出最符合用户需求的一个或几个实体服务,关键在于挖掘出用户兴趣偏好实现个性化推荐。尽管众多产业界巨头均开始以不同角度布局物联网服务产业平台,但受限于当前物联网市场的碎片化发展,尚未有一家平台能积累足够数量和质量的用户反馈信息来挖掘用户兴趣偏好。虽然有研究工作表明利用智能感知技术和近距通信技术搜集和记录用户与实体服务的交互行为,可以有效挖掘出用户的兴趣偏好。然而,用户与实体服务交互行为往往蕴含用户的作息时间和行为习惯等敏感度较高的隐私信息,极大增加了用户的隐私暴露风险。
发明内容
本发明的目的是克服现有技术中的不足,提供了一种隐私保护的物联网实体服务搜索方法,所述技术方案如下:
S1、利用物联网实体服务提供者的多源异构信息,通过表征学习得到物联网实体服务的表示向量;所述多源异构信息包括社交网络、描述文档和服务属性标签;
S2、结合物联网实体服务的表示向量和属性标签,建立物联网实体服务的数据图表示模型;
S3、对用户搜索偏好进行挖掘并建立个性化搜索排序模型;
S4、通过语义模型从用户的检索关键字中挖掘出其搜索意图,并通过所述个性化搜索排序模型向用户提供候选的实体服务搜索排序列表;
S5、采用本地用户因子向量更新和全局服务表示因子矩阵更新获取隐私保护的个性化搜索结果。
作为优选,S1包括:
S101、采用图神经网络对物联网实体服务提供者的社交网络的图结构进行编码和压缩;
S102、基于跳字模型建模学习物联网实体服务的初始分布式表示向量。
作为优选,S101包括:
S1011、采用图神经网络对物联网实体服务提供者的社交网络的图结构进行编码,并将编码结果在不同的邻边类型上共享,抽取不同社交关系邻边类型对目标服务结点及其相邻结点进行初始化赋值;
S1012、使用均值算子递归计算邻边编码;
S1013、加入目标服务属性标签的one-hot编码,并进行编码耦合,形成预处理编码并进行编码压缩。
作为优选,S102包括:
S1021、利用跳字模型获得物联网实体服务多源异构信息的初始分布式表示向量;
S1022、利用深度神经网络,输入目标服务结点的初始分布式表示向量,预测目标服务结点的相邻结点的表示向量;
S1023、对目标结点的邻边信息和相邻点编码信息进行图卷积,聚合得到目标服务节点的分布式表示向量。
作为优选,S2包括:
S201、基于S1中表示向量的计算服务之间的余弦相似性,在余弦相似性大于预设阈值的服务之间建立语义连接;
S202、通过物联网实体服务的属性标签建立不同服务在时空、物理和逻辑上的上下文情景关系,构建物联网实体服务上下文情景关系及语义关联的图表示模型,记为数据图;所述数据图的顶点表示物联网实体服务对象,具有元素为二元组<键,值>对的属性列表;所述数据图的边表示两个物品之间的上下文情景关系和语义关系。
作为优选,S3包括:
S301、基于用户搜索历史的统计信息和时空情景,对用户搜索偏好进行建模;
S302、通过训练样本提取和相关性排序模型训练,构建用户的个性化搜索排序模型。
作为优选,S302包括:
S3021、训练样本提取:对于有查询日志的用户,从用户的查询日志中提取出查询图以及相应的检索结果,根据用户的反馈信息获得检索结果的排序列表,基于所述排序列表构建训练样本;对于没有查询日志的用户,在物品数据图中随机选择一些子图作为查询模板,将查询模板中节点和边用不同的转换函数进行转化得到查询图,找出与查询图精确匹配的数据子图,从而生成模型训练样本;
S3022、相关性排序模型训练:给定查询图R及其匹配子图Φ(R),图顶点相关性评分函数SV(v,φ(v))用于计算查询图的顶点v与其在数据图中的匹配节点φ(v)之间的匹配得分,聚合了物品所有属性的匹配得分,表示为:
其中,Θ是二值函数,若v与φ(v)在内容上匹配则Θ(v,φ(v))=1,否则为0;i为物品属性;αi为i的顶点匹配权重;
边相关性评分函数SE(e,φ(e))聚合了物品所有上下文情景关系的匹配得分,表示为:
其中,e为查询图的边;φ(e)为e在数据图中的匹配边;j为物品属性;βj为j的顶点匹配权重;
P(φ(R)|R)为查询图R及其匹配子图Φ(R)的相关性排序函数,表示为:
P(φ(R)|R)=f(SV(v,φ(v)),SE(e,φ(e)))
其中,f为相关性排序模型。
作为优选,所述相关性排序模型f的估计参数Q表示为:
Q={α1,α2,…;β1,β2,…}=argmax∑D log P(φ(R)|R)
其中,argmax函数用于获取后面式子取得最大值时的参数值,D为给定的训练集。
作为优选,S4包括:
S401、采取本体建模的方法,对用户的检索关键字进行语义建模,构造用户查询图;
S402、通过用户的个性化搜索排序模型,向用户提供最终的搜索排序列表。
作为优选,S5包括:
S501、搜索服务器随机初始化协同过滤搜索模型的本地用户因子向量,以实体服务表示向量初始化全局服务因子矩阵,并将初始化后的协同过滤搜索模型的本地用户因子向量与全局服务因子矩阵分发给每个用户;
S502、利用K-means聚类算法和用户兴趣偏好相似度将每一轮的m个搜索用户划分为p个集群的集合,从已划分好的每个集群中随机选择m/p个参与者参与协同过滤搜索模型训练;
S503、每个搜索用户将本地历史搜索记录划分为训练集和测试集,通过训练集更新本地协同过滤搜索模型的参数,随后利用测试集计算损失函数和相应的更新梯度,实现全局服务因子矩阵的本地更新并加密上传到实体服务搜索服务器;
S504、物联网实体服务搜索服务器解密每个搜索用户上传的全局服务因子矩阵,采用平均合并的方式更新协同过滤搜索模型,得到新的全局服务因子矩阵;
S505、所述本地用户因子向量保存着每个搜索用户的历史搜索记录和时空情景,利用S4对用户搜索偏好建模实现本地用户因子向量更新,并将更新的全局商品因子矩阵和本地用户因子向量更新参数发送给下一轮搜索参与者,直到协同过滤搜索模型收敛或达到指定的训练轮数;
S506、对S4产生的候选的实体服务搜索排序列表进行过滤,将剩下的实体服务搜索排序列表中的实体服务作为最终的搜索结果。
本发明的有益效果是:本发明提出了一种隐私保护的物联网实体服务搜索方法,建立了异构物联网实体服务的关联融合图,并对用户搜索意图深度挖掘,实现面向物联网实体服务因人而异的优质搜索结果,提升了用户服务满意度。此外,本发明有望应用于物联网的多个场景,例如,实现实体购物商店的个性化搜索以及建筑工地中建筑工具搜寻等,可以更好地服务国计民生,具有较高的社会经济价值。
附图说明
图1为本申请提供的隐私保护的物联网实体服务搜索方法的整体流程图;
图2为本申请提供的获取物联网实体服务的表示向量的流程图;
图3为本申请提供的建立个性化搜索排序模型的流程图;
图4为本申请提供的向用户提供候选的实体服务搜索排序列表的流程图;
图5为本申请提供的获取隐私保护的个性化搜索结果的流程图。
具体实施方式
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
实施例1:
在缺少用户注册信息、历史服务调用信息和用户数据隐私敏感的情况下,为了实现物联网环境下隐私保护的个性化实体服务搜索,本申请提出了一种隐私保护的物联网实体服务搜索方法,如图1所示,包括:
S1、利用物联网实体服务提供者的多源异构信息,通过表征学习得到物联网实体服务的表示向量;多源异构信息包括社交网络、描述文档和服务属性标签;
在S1中,表示向量具有低维、稠密且蕴含丰富异质信息的特点。
S2、结合物联网实体服务的表示向量和属性标签,建立物联网实体服务的数据图表示模型;
S3、对用户搜索偏好进行挖掘并建立个性化搜索排序模型;
用户搜索偏好可以包括用户的历史服务搜索关键词记录、选取搜索结果记录等历史信息。
S4、通过语义模型从用户的检索关键字中挖掘出其搜索意图,并通过个性化搜索排序模型向用户提供候选的实体服务搜索排序列表;
S5、采用本地用户因子向量更新和全局服务表示因子矩阵更新获取隐私保护的个性化搜索结果。
如图2所示,S1包括:
S101、采用图神经网络对物联网实体服务提供者的社交网络的图结构进行编码和压缩;
S102、基于跳字模型建模学习物联网实体服务的初始分布式表示向量。
其中,S101包括:
S1011、采用图神经网络对物联网实体服务提供者的社交网络的图结构进行编码,并将编码结果在不同的邻边类型上共享,抽取不同社交关系邻边类型对目标服务结点及其相邻结点进行初始化赋值;
S1012、使用均值算子递归计算邻边编码;
S1013、加入目标服务属性标签的one-hot编码,并进行编码耦合,形成预处理编码并进行编码压缩。
S102包括:
S1021、利用跳字模型获得物联网实体服务多源异构信息的初始分布式表示向量;
S1022、利用深度神经网络,输入目标服务结点的初始分布式表示向量,预测目标服务结点的相邻结点的表示向量;
S1023、对目标结点的邻边信息和相邻点编码信息进行图卷积,聚合得到目标服务节点的分布式表示向量。
S2包括:
S201、基于S1中表示向量的计算服务之间的余弦相似性,在余弦相似性大于预设阈值的服务之间建立语义连接;
S202、通过物联网实体服务的属性标签建立不同服务在时空、物理和逻辑上的上下文情景关系,构建物联网实体服务上下文情景关系及语义关联的图表示模型,记为数据图;数据图的顶点表示物联网实体服务对象,具有元素为二元组<键,值>对的属性列表;数据图的边表示两个物品之间的上下文情景关系和语义关系。
如图3所示,S3包括:
S301、基于用户搜索历史的统计信息和时空情景,对用户搜索偏好进行建模;
在S301中,通过以下两种方式对用户搜索偏好进行建模:
1)基于统计分析的用户偏好建模。根据用户的历史搜索关键词记录、选取搜索结果记录等历史偏好的统计信息,来理解用户的意图,从而为用户提供个性化的推荐结果。基于统计分析的用户意图理解通过获取不同用户实体服务搜索和使用记录、所关注的领域等等个人信息,建立用户模型。引用统计的历史偏好因素后,相同搜索关键词得到的搜索结果的权重将会因用户而不同,从而实现不同的意图理解。
2)基于时空特性的用户偏好建模。基于时空特性的用户意图理解是指用户在查询表达式中没有给出时间或空间限定词,查询过程会根据执行查询的时间、地理位置的不同理解此次查询的潜在时间或空间意图。
S302、通过训练样本提取和相关性排序模型训练,构建用户的个性化搜索排序模型。
S302包括:
S3021、训练样本提取。对于有查询日志的用户,从用户的查询日志中提取出查询图以及相应的检索结果,根据用户的反馈信息获得检索结果的排序列表,基于排序列表构建训练样本;对于没有查询日志的用户,在物品数据图中随机选择一些子图作为查询模板,将查询模板中节点和边用不同的转换函数(如数值范围转换、相似语义转换和文本转换等)进行转化得到查询图,找出与查询图精确匹配的数据子图,从而生成模型训练样本;
S3022、相关性排序模型训练。对异构物品搜索的相关性排序模型f进行如下形式化描述:给定查询图R及其匹配子图Φ(R),图顶点相关性评分函数SV(v,φ(v))用于计算查询图的顶点v与其在数据图中的匹配节点φ(v)之间的匹配得分,聚合了物品所有属性的匹配得分,表示为:
其中,Θ是二值函数,若v与φ(v)在内容上匹配则Θ(v,φ(v))=1,否则为0;i为物品属性(例如,价格、精度等);αi为i的顶点匹配权重(预先由用户设定);
边相关性评分函数SE(e,φ(e))聚合了物品所有上下文情景关系的匹配得分,表示为:
其中,e为查询图的边;φ(e)为e在数据图中的匹配边;j为物品属性(例如,价格、精度等);βj为j的顶点匹配权重(预先由用户设定);
P(φ(R)|R)为查询图R及其匹配子图Φ(R)的相关性排序函数,表示为:
P(φ(R)|R)=f(SV(v,φ(v)),SE(e,φ(e)))
其中,f为相关性排序模型,且相关性排序模型f需要符合两个条件:1)给定训练集D,训练得到模型参数Q需要尽可能的拟合给定查询的排序结果;2)该相关性排序模型在在线查询阶段需要能快速获得一个给定查询的排序结果,因为通过枚举所有可能的子图匹配结果进行排序是不可行的。
本申请将借鉴排序学习研究领域的相关研究成果,设计满足上述两个条件的相关性排序模型f。给定训练集D,采用极大似然法推理得到排序模型的估计参数Q,表示为:
Q={α1,α2,…;β1,β2,…}=argmax∑D log P(φ(R)|R)
其中,argmax函数用于获取后面式子取得最大值时的参数值,D为给定的训练集。
如图4所示,S4包括:
S401、采取本体建模的方法,对用户的检索关键字进行语义建模,构造用户查询图;
在S401中,首先,分析识别出用户检索关键字涉及的实体对象,构建查询图的顶点;其次,通过本体建模的方法刻画出所涉及物品的属性信息,并从用户携带移动设备或者可穿戴设备中识别出用户的搜索情景(如时空情景、活动情景和环境状况情景等),基于用户的搜索情景与所涉及实体服务之间的上下文情景关系构建查询图的边。
S402、通过用户的个性化搜索排序模型,向用户提供最终的搜索排序列表。
在S402中,首先应用个性化排序模型计算查询图与S2构造的实体服务数据图表示模型的顶点匹配和边匹配得分,顶点匹配包括物品语义标签和属性信息的匹配,而边匹配主要涉及上下文情景关系的匹配。根据顶点与边的匹配得分总和产生的候选搜索结果列表。
如图5所示,S5包括:
S501、搜索服务器随机初始化协同过滤搜索模型的本地用户因子向量,以实体服务表示向量初始化全局服务因子矩阵,并将初始化后的协同过滤搜索模型的本地用户因子向量与全局服务因子矩阵分发给每个用户;
S502、利用K-means聚类算法和用户兴趣偏好相似度将每一轮的m个搜索用户划分为p个集群的集合,从已划分好的每个集群中随机选择m/p个参与者参与协同过滤搜索模型训练;
S503、每个搜索用户将本地历史搜索记录划分为训练集和测试集,通过训练集更新本地协同过滤搜索模型的参数,随后利用测试集计算损失函数和相应的更新梯度,实现全局服务因子矩阵的本地更新并加密上传到实体服务搜索服务器;
S504、物联网实体服务搜索服务器解密每个搜索用户上传的全局服务因子矩阵,采用平均合并的方式更新协同过滤搜索模型,得到新的全局服务因子矩阵;
S505、本地用户因子向量保存着每个搜索用户的历史搜索记录和时空情景,利用S4对用户搜索偏好建模实现本地用户因子向量更新,并将更新的全局商品因子矩阵和本地用户因子向量更新参数发送给下一轮搜索参与者,直到协同过滤搜索模型收敛或达到指定的训练轮数;
S506、对S4产生的候选的实体服务搜索排序列表进行过滤,将剩下的实体服务搜索排序列表中的实体服务作为最终的搜索结果。
综上所述,本申请提供的隐私保护的物联网实体服务搜索方法,可以建立异构物联网实体服务的关联融合图,并对用户搜索意图深度挖掘,实现面向物联网实体服务因人而异的优质搜索结果。
Claims (10)
1.一种隐私保护的物联网实体服务搜索方法,其特征在于,包括以下步骤:
S1、利用物联网实体服务提供者的多源异构信息,通过表征学习得到物联网实体服务的表示向量;所述多源异构信息包括社交网络、描述文档和服务属性标签;
S2、结合物联网实体服务的表示向量和属性标签,建立物联网实体服务的数据图表示模型;
S3、对用户搜索偏好进行挖掘并建立个性化搜索排序模型;
S4、通过语义模型从用户的检索关键字中挖掘出其搜索意图,并通过所述个性化搜索排序模型向用户提供候选的实体服务搜索排序列表;
S5、采用本地用户因子向量更新和全局服务表示因子矩阵更新获取隐私保护的个性化搜索结果。
2.根据权利要求1所述的隐私保护的物联网实体服务搜索方法,其特征在于,S1包括:
S101、采用图神经网络对物联网实体服务提供者的社交网络的图结构进行编码和压缩;
S102、基于跳字模型建模学习物联网实体服务的初始分布式表示向量。
3.根据权利要求2所述的隐私保护的物联网实体服务搜索方法,其特征在于,S101包括:
S1011、采用图神经网络对物联网实体服务提供者的社交网络的图结构进行编码,并将编码结果在不同的邻边类型上共享,抽取不同社交关系邻边类型对目标服务结点及其相邻结点进行初始化赋值;
S1012、使用均值算子递归计算邻边编码;
S1013、加入目标服务属性标签的one-hot编码,并进行编码耦合,形成预处理编码并进行编码压缩。
4.根据权利要求2所述的隐私保护的物联网实体服务搜索方法,其特征在于,S102包括:
S1021、利用跳字模型获得物联网实体服务多源异构信息的初始分布式表示向量;
S1022、利用深度神经网络,输入目标服务结点的初始分布式表示向量,预测目标服务结点的相邻结点的表示向量;
S1023、对目标结点的邻边信息和相邻点编码信息进行图卷积,聚合得到目标服务节点的分布式表示向量。
5.根据权利要求1所述的隐私保护的物联网实体服务搜索方法,其特征在于,S2包括:
S201、基于S1中表示向量的计算服务之间的余弦相似性,在余弦相似性大于预设阈值的服务之间建立语义连接;
S202、通过物联网实体服务的属性标签建立不同服务在时空、物理和逻辑上的上下文情景关系,构建物联网实体服务上下文情景关系及语义关联的图表示模型,记为数据图;所述数据图的顶点表示物联网实体服务对象,具有元素为二元组<键,值>对的属性列表;所述数据图的边表示两个物品之间的上下文情景关系和语义关系。
6.根据权利要求1所述的隐私保护的物联网实体服务搜索方法,其特征在于,S3包括:
S301、基于用户搜索历史的统计信息和时空情景,对用户搜索偏好进行建模;
S302、通过训练样本提取和相关性排序模型训练,构建用户的个性化搜索排序模型。
7.根据权利要求6所述的隐私保护的物联网实体服务搜索方法,其特征在于,S302包括:
S3021、训练样本提取:对于有查询日志的用户,从用户的查询日志中提取出查询图以及相应的检索结果,根据用户的反馈信息获得检索结果的排序列表,基于所述排序列表构建训练样本;对于没有查询日志的用户,在物品数据图中随机选择一些子图作为查询模板,将查询模板中节点和边用不同的转换函数进行转化得到查询图,找出与查询图精确匹配的数据子图,从而生成模型训练样本;
S3022、相关性排序模型训练:给定查询图R及其匹配子图Φ(R),图顶点相关性评分函数SV(v,φ(v))用于计算查询图的顶点v与其在数据图中的匹配节点φ(v)之间的匹配得分,聚合了物品所有属性的匹配得分,表示为:
其中,Θ是二值函数,若v与φ(v)在内容上匹配则Θ(v,φ(v))=1,否则为0;i为物品属性;αi为i的顶点匹配权重;
边相关性评分函数SE(e,φ(e))聚合了物品所有上下文情景关系的匹配得分,表示为:
其中,e为查询图的边;φ(e)为e在数据图中的匹配边;j为物品属性;βj为j的顶点匹配权重;
P(φ(R)|R)为查询图R及其匹配子图Φ(R)的相关性排序函数,表示为:
P(φ(R)|R)=f(SV(v,φ(v)),SE(e,φ(e)))
其中,f为相关性排序模型。
8.根据权利要求7所述的隐私保护的物联网实体服务搜索方法,其特征在于,所述相关性排序模型f的估计参数Q表示为:
Q={α1,α2,…;β1,β2,…}=argmax∑DlogP(φ(R)|R)
其中,argmax函数用于获取后面式子取得最大值时的参数值,D为给定的训练集。
9.根据权利要求1所述的隐私保护的物联网实体服务搜索方法,其特征在于,S4包括:
S401、采取本体建模的方法,对用户的检索关键字进行语义建模,构造用户查询图;
S402、通过用户的个性化搜索排序模型,向用户提供最终的搜索排序列表。
10.根据权利要求9所述的隐私保护的物联网实体服务搜索方法,其特征在于,S5包括:
S501、搜索服务器随机初始化协同过滤搜索模型的本地用户因子向量,以实体服务表示向量初始化全局服务因子矩阵,并将初始化后的协同过滤搜索模型的本地用户因子向量与全局服务因子矩阵分发给每个用户;
S502、利用K-means聚类算法和用户兴趣偏好相似度将每一轮的m个搜索用户划分为p个集群的集合,从已划分好的每个集群中随机选择m/p个参与者参与协同过滤搜索模型训练;
S503、每个搜索用户将本地历史搜索记录划分为训练集和测试集,通过训练集更新本地协同过滤搜索模型的参数,随后利用测试集计算损失函数和相应的更新梯度,实现全局服务因子矩阵的本地更新并加密上传到实体服务搜索服务器;
S504、物联网实体服务搜索服务器解密每个搜索用户上传的全局服务因子矩阵,采用平均合并的方式更新协同过滤搜索模型,得到新的全局服务因子矩阵;
S505、所述本地用户因子向量保存着每个搜索用户的历史搜索记录和时空情景,利用S4对用户搜索偏好建模实现本地用户因子向量更新,并将更新的全局商品因子矩阵和本地用户因子向量更新参数发送给下一轮搜索参与者,直到协同过滤搜索模型收敛或达到指定的训练轮数;
S506、对S4产生的候选的实体服务搜索排序列表进行过滤,将剩下的实体服务搜索排序列表中的实体服务作为最终的搜索结果。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210414586.0A CN114817715A (zh) | 2022-04-20 | 2022-04-20 | 一种隐私保护的物联网实体服务搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210414586.0A CN114817715A (zh) | 2022-04-20 | 2022-04-20 | 一种隐私保护的物联网实体服务搜索方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114817715A true CN114817715A (zh) | 2022-07-29 |
Family
ID=82504672
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210414586.0A Withdrawn CN114817715A (zh) | 2022-04-20 | 2022-04-20 | 一种隐私保护的物联网实体服务搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114817715A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116628181A (zh) * | 2023-07-21 | 2023-08-22 | 无锡小净共享网络科技有限公司 | 基于物联网的用户控制偏好感知方法及系统 |
CN117931812A (zh) * | 2024-03-25 | 2024-04-26 | 北京大数据先进技术研究院 | 一种面向数据空间的数字对象元注册表系统及搜索方法 |
-
2022
- 2022-04-20 CN CN202210414586.0A patent/CN114817715A/zh not_active Withdrawn
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116628181A (zh) * | 2023-07-21 | 2023-08-22 | 无锡小净共享网络科技有限公司 | 基于物联网的用户控制偏好感知方法及系统 |
CN116628181B (zh) * | 2023-07-21 | 2023-09-22 | 无锡小净共享网络科技有限公司 | 基于物联网的用户控制偏好感知方法及系统 |
CN117931812A (zh) * | 2024-03-25 | 2024-04-26 | 北京大数据先进技术研究院 | 一种面向数据空间的数字对象元注册表系统及搜索方法 |
CN117931812B (zh) * | 2024-03-25 | 2024-06-07 | 北京大数据先进技术研究院 | 一种面向数据空间的数字对象元注册表系统及搜索方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104462385B (zh) | 一种基于用户兴趣模型的电影个性化相似度计算方法 | |
Jiang et al. | Fema: flexible evolutionary multi-faceted analysis for dynamic behavioral pattern discovery | |
Caicedo et al. | Multimodal representation, indexing, automated annotation and retrieval of image collections via non-negative matrix factorization | |
CN111259263B (zh) | 一种物品推荐方法、装置、计算机设备及存储介质 | |
WO2016169192A1 (zh) | 用户相似度确定方法和装置 | |
CN111859160B (zh) | 一种基于图神经网络会话序列推荐方法及系统 | |
US10262299B2 (en) | Efficient recommendation services | |
US20180232661A1 (en) | Member clustering with equi-sized partitions | |
CN114817715A (zh) | 一种隐私保护的物联网实体服务搜索方法 | |
CN117836765A (zh) | 基于多模态超图的点击预测 | |
CN111429161B (zh) | 特征提取方法、特征提取装置、存储介质及电子设备 | |
Lyu et al. | Weighted multi-information constrained matrix factorization for personalized travel location recommendation based on geo-tagged photos | |
Rohilla et al. | Random Forest with harmony search optimization for location based advertising | |
CN115712780A (zh) | 一种基于云计算和大数据的信息推送方法及装置 | |
CN110069713A (zh) | 一种基于用户上下文感知的个性化推荐方法 | |
Wang et al. | Link prediction in heterogeneous collaboration networks | |
Yuan et al. | CHOP: An orthogonal hashing method for zero-shot cross-modal retrieval | |
Kianian et al. | Semantic community detection using label propagation algorithm | |
Zhang et al. | Matching state estimation scheme for content-based sensor search in the Web of things | |
CN117390289B (zh) | 基于用户画像的房屋建造方案推荐方法、装置、设备 | |
Ali et al. | Dynamic context management in context-aware recommender systems | |
Gupta et al. | A recommender system based on collaborative filtering, graph theory using HMM based similarity measures | |
Ouaftouh et al. | Social recommendation: A user profile clustering‐based approach | |
Chu et al. | Adaptive convex clustering of generalized linear models with application in purchase likelihood prediction | |
CN113704617A (zh) | 物品推荐方法、系统、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WW01 | Invention patent application withdrawn after publication | ||
WW01 | Invention patent application withdrawn after publication |
Application publication date: 20220729 |