CN109885644B - 一种用于物联网物品信息搜索排序的重要性评估方法 - Google Patents

一种用于物联网物品信息搜索排序的重要性评估方法 Download PDF

Info

Publication number
CN109885644B
CN109885644B CN201910276489.8A CN201910276489A CN109885644B CN 109885644 B CN109885644 B CN 109885644B CN 201910276489 A CN201910276489 A CN 201910276489A CN 109885644 B CN109885644 B CN 109885644B
Authority
CN
China
Prior art keywords
article
implicit
item
link relation
information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201910276489.8A
Other languages
English (en)
Other versions
CN109885644A (zh
Inventor
陈垣毅
周铭煊
郑增威
陈丹
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhejiang University City College ZUCC
Original Assignee
Zhejiang University City College ZUCC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhejiang University City College ZUCC filed Critical Zhejiang University City College ZUCC
Priority to CN201910276489.8A priority Critical patent/CN109885644B/zh
Publication of CN109885644A publication Critical patent/CN109885644A/zh
Application granted granted Critical
Publication of CN109885644B publication Critical patent/CN109885644B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及一种用于物联网物品信息搜索排序的重要性评估方法,包括步骤:1)A、物品隐式链接关系挖掘;2)物品隐式链接关系图构建,提取特征;3)融合物品显式特征与隐式特征进行重要性评估。本发明的有益效果是:本发明涉及一种用于物联网物品信息搜索排序的重要性评估方法,深度挖掘物品交织互动行为,利用蕴含丰富时空模式和用户生活习惯的物品交织互动行为信息可以挖掘出物品之间的隐式链接关系,建立对于候选物品的重要性评估的方法;本专利提出的方法深度挖掘物品交织互动行为,建立融合物品显式特征和隐式链接关系的候选物品重要性评估方法。

Description

一种用于物联网物品信息搜索排序的重要性评估方法
技术领域
本发明涉及一种重要性评估方法,具体涉及一种用于物联网物品信息搜索排序的重要性评估方法。
背景技术
随着廉价微型传感器、无线通信技术和移动计算技术的迅速发展和普及,众多具有感知、计算以及通信能力的现实世界物品(如可穿戴设备、智能仪表、钥匙串和座椅等)将广泛存在于物联网中。可以预见,正如当前利用网络搜索引擎查找互联网信息一样,随着各种应用领域(如环境监测、智能家居、智能物流和智能建筑工地等)对现实世界物品信息查找和浏览需求的日益增长,很快人们将能在英特网上查找和浏览现实世界中的各种物品信息。从用户的角度考虑,由于时间、精力以及移动设备资源有限等原因,用户往往只关注物品搜索结果列表的第一项或前几项内容。因此,在基于用户查询关键字检索出海量的候选物品后,如何对这些候选物品进行排序以快速发掘出符合用户查询意图的物品信息成为国内外学界、业界研究的热点问题。
物联网物品搜索排序主要涉及候选物品与用户查询意图的相关性评估和候选物品自身的重要性评估两个方面。现有研究中,物联网物品既没有类似网页之间的超链接关系,也没有类似社交网络中用户之间的好友关系,导致基于链接的重要性评估方法(如PageRank、HITS等)不能直接应用于候选物品的重要性评估。因此,如何对没有显式链接关系的候选物品建立重要性评估方法是物联网物品搜索排序需要解决的另一个难题。
发明内容
本发明的目的在于克服现有技术的不足,提供一种用于物联网物品信息搜索排序的重要性评估方法。
这种用于物联网物品信息搜索排序的重要性评估方法,包括如下步骤:
A、物品隐式链接关系挖掘
B、物品隐式链接关系图构建,提取特征
C、融合物品显式特征与隐式特征进行重要性评估
作为优选,步骤A包括以下步骤:
A11、收集三类物品交织互动行为信息:交织互动行为涉及的物品、交织互动行为发生的时间以及交织互动行为发生位置。
A12、通过提取细粒度的物品交互特征,结合物品内容与属性等信息,对物品隐式链接关系应用潜变量模型进行建模挖掘。
作为优选,步骤B包括以下步骤:
B11、构建物品隐式链接关系图。
B12、从物品隐式链接关系图提取节点拓扑结构的特征和边权重的特征用于候选物品的重要性评估。
作为优选,步骤B12包括以下步骤:
B121、建立出发物品、中介物品与目标物品的转移概率矩阵。
B122、根据随机游走算法计算三种物品之间的重启动向量。
B123、算法收敛后得到稳定的隐式链接关系强度。
作为优选,步骤C包括以下步骤:
C11、利用物品传感信息和文本信息提取物品显式特征。
C12、利用用户历史查询信息提取用户点击过的物品信息,并依据用户点击顺序生成训练样本,建立候选物品的重要性评估模型。
本发明的有益效果是:
本发明涉及一种用于物联网物品信息搜索排序的重要性评估方法,主要是深度挖掘物品交织互动行为,利用蕴含丰富时空模式和用户生活习惯的物品交织互动行为信息可以挖掘出物品之间的隐式链接关系,建立对于候选物品的重要性评估的方法。
本专利提出的方法深度挖掘物品交织互动行为,利用蕴含丰富时空模式和用户生活习惯的物品交织互动行为信息可以挖掘出物品之间的隐式链接关系,从而建立融合物品显式特征和隐式链接关系的候选物品重要性评估方法。
附图说明
图1是候选物品重要性评估方法的建立流程图;
图2是不同传感器的信息收集、隐式链接关系提取流程图;
图3是得到完整隐式链接关系向量的流程图;
图4是物品隐式链接关系示意图;
图5是出发物品、中间物品与目标物品示意图;
图6是物品重要性计算流程图。
具体实施方式
下面结合实施例对本发明做进一步描述。下述实施例的说明只是用于帮助理解本发明。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以对本发明进行若干改进和修饰,这些改进和修饰也落入本发明权利要求的保护范围内。
一、本发明的整体思想:
我们主要考虑以下两个方面:如何从物品信息中挖掘隐式关系、提取隐式特征;如何根据物品的隐式、显式特征进行候选物品的重要性评估。
二、本发明所述的这种产生候选物品重要性的方法的具体实施方式包括以下步骤,如图1所示
A、物品隐式链接关系挖掘,如图2所示
步骤A包括以下步骤:
A11、收集三类物品交织互动行为信息:交织互动行为涉及的物品、交织互动行为发生的时间以及交织互动行为发生位置。基于多传感器,根据不同类型传感信息更新频率的差别,采用发布/订阅的方式对传感信息进行收集。采用状态传感器获取物品交织互动行为的起止时间;对于室外发生的物品交织互动行为,采用GPS获得交互物品的位置信息;对于室内发生的物品交织互动行为,采用基于位置指纹的定位方法获取交互物品的位置信息。
A12、通过提取细粒度的物品交互特征(例如,交互时间的概率分布、交互位置蕴含的语义信息以及交互活动蕴含的用户行为习惯等),结合物品内容与属性等信息,对物品隐式链接关系应用潜变量模型进行建模挖掘。鉴于物品参与交织互动行为的频率与其隐式链接关系强度存在正相关性,将物品内容信息、属性以及从交织互动行为提取的细粒度交互特征作为观察变量,将物品隐式链接关系强度作为影响物品交织互动行为的潜变量,利用概率图构建物品隐式链接关系的潜变量挖掘模型。
B、物品隐式链接关系图构建,提取特征,如图3所示
步骤B包括以下步骤:
B11、构建物品隐式链接关系图,如图4所示。其中,以物品作为该关系图的节点,以物品之间的隐式链接关系强度作为该关系图的边权重。图中实线代表隐式链接关系中挖掘出的隐式链接关系强度,虚线则代表尚未求取的隐式关系强度。
B12、从物品隐式链接关系图提取两类特征用于候选物品的重要性评估,一类是从物品隐式链接关系图节点拓扑结构提取的特征,包括节点的度、中心度、介数和特征向量中心性等。另一类是从物品隐式链接关系图边权重提取的特征,采用随机游走算法获取每对物品之间的隐式链接关系强度,将节点所有邻接边的权重组合为特征向量。
步骤B12包括以下步骤:
B121、可以将物品分为三类:出发物品、中介物品与目标物品,其关系图如图5所示(在计算时,通常只有一个出发物品,目标物品则可能有多个)。因此,可以表示这三类物品的转移概率。其中,X是出发物品与中介物品之间的隐式关系强度,Y是中介物品与目标物品之间的隐式关系强度,状态转移矩阵(TO、TB、TD)表示允许顶点通过随机游走以一定概率回到原顶点,以对角矩阵表示。
B122、令
Figure GDA0002945855010000041
表示对出发物品与出发物品、中介物品、目标物品之间的隐式关系强度向量,αo、αb、αd是随机游走传播算法重新启动的概率,设置为0.05。令Vo、Vb、Vd表示所有出发物品、中介物品与目标物品顶点的重启动向量,所有元素初始化为0,随机游走向量o、b、d初始化为1,随机游走传播过程如下(
Figure GDA0002945855010000042
使用Vo、Vb、Vd进行初始化):
Figure GDA0002945855010000043
Figure GDA0002945855010000044
Figure GDA0002945855010000045
其中
Figure GDA0002945855010000046
Figure GDA0002945855010000047
的计算过程类似。
B123、算法收敛之后,HD即尚未得到的隐式链接关系强度,与已知的隐式链接关系强度共同组成了出发物品的隐式链接关系强度特征向量。
C、融合物品显式特征和隐式特征进行重要性评估,如图6所示
步骤C包括以下步骤:
C11、利用物品传感信息和文本信息提取物品显式特征,例如,地理位置、信息时效性等。
C12、提取出物品的显式特征及隐式特征,利用用户历史查询信息提取用户点击过的物品信息,并依据用户点击顺序生成训练样本,借鉴排序学习思想建立候选物品的重要性评估模型,如图6所示。
对于物品i1,i2,……,in,假定其对应的显式特征向量与隐式特征向量组合之后的特征向量为δ1,δ2,……,δn,每个特征向量的维度分别是m维。假设对应的权重向量为W=(w1,w2,……,wm),用户对物品的点击顺序向量是η=(t1,t2,……,tn),其中ti代表第i个物品的点击顺序。为方便表示,假定该向量为增序,则不断调整权重向量W,使得:
δ1W<δ2W<……<δnW
从而查询新物品时inew,通过计算δnewW可以得到物品的重要性。
三、实施实例:
假定有四个物品,分别记为物品1,物品2,物品3,物品4,其中物品1与物品3、物品4存在已知的隐式链接关系,与物品2的隐式链接关系待求取。同时,物品3、物品4与物品2也存在已知的隐式链接关系。
假设物品1与物品3的关系强度为2,物品1与物品4的关系强度为3;
物品3与物品2的强度为1,物品4与物品2的强度为4。
物品3与物品4的强度为2。
则有
TO=[1];
TB=[2,0;0,2];
TD=[1];
Y=[2,3];
X=[1,4];
Figure GDA0002945855010000051
设重启动向量Vo、Vb、Vd均为0.2,即Vo=[0.2],Vb=[0.2,0.2],Vd=[0.2],则有:
Figure GDA0002945855010000052
Figure GDA0002945855010000053
假设状态转移矩阵均为0,则一次游走之后:
Figure GDA0002945855010000054
Figure GDA0002945855010000055
Figure GDA0002945855010000056
重复计算直到收敛。
假定仅有两个物品,其隐式链接向量分别是(1,2)、(2,1),显式链接向量是(3,4)、(4,3),则组合向量是((1,2,3,4),(2,1,4,3))。假定权重向量初始为(1,2,1,2),点击顺序是(1,2),此时δ1W=16,δ2W=14,与点击顺序不符。
调整权重向量至(2,1,1,1),此时δ1W=11,δ2W=12,与点击顺序相符,则该向量可用于计算新加入的物品重要性。

Claims (1)

1.一种用于物联网物品信息搜索排序的重要性评估方法,其特征在于,包括如下步骤:
A、物品隐式链接关系挖掘;
A11、收集三类物品交织互动行为信息:交织互动行为涉及的物品、交织互动行为发生的时间以及交织互动行为发生位置;
A12、通过提取细粒度的物品交互特征,结合物品内容与属性信息,对物品隐式链接关系应用潜变量模型进行建模挖掘;
B、物品隐式链接关系图构建,提取特征;
B11、构建物品隐式链接关系图;
B12、从物品隐式链接关系图提取节点拓扑结构的特征和边权重的特征用于候选物品的重要性评估;
步骤B12包括以下步骤:
B121、将物品分为三类:出发物品、中介物品与目标物品,其中,X是出发物品与中介物品之间的隐式关系强度,Y是中介物品与目标物品之间的隐式关系强度,状态转移矩阵(TO、TB、TD)表示允许顶点通过随机游走以一定概率回到原顶点,以对角矩阵表示;
B122、令
Figure FDA0002945854000000011
表示对出发物品与出发物品、中介物品、目标物品之间的隐式关系强度向量,αo、αb、αd是随机游走传播算法重新启动的概率,均设置为0.05;令Vo、Vb、Vd表示所有出发物品、中介物品与目标物品顶点的重启动向量,所有元素初始化为0,随机游走向量o、b、d初始化为1,随机游走传播过程如下,
Figure FDA0002945854000000012
使用Vo、Vb、Vd进行初始化:
Figure FDA0002945854000000013
Figure FDA0002945854000000014
Figure FDA0002945854000000015
其中
Figure FDA0002945854000000016
Figure FDA0002945854000000017
B123、算法收敛之后,HD即尚未得到的隐式链接关系强度,与已知的隐式链接关系强度共同组成了出发物品的隐式链接关系强度特征向量;
C、融合物品显式特征与隐式特征进行重要性评估;
C11、利用物品传感信息和文本信息提取物品显式特征;
C12、提取出物品的显式特征及隐式特征,利用用户历史查询信息提取用户点击过的物品信息,并依据用户点击顺序生成训练样本,建立候选物品的重要性评估模型,对于物品i1,i2,……,in,假定其对应的显式特征向量与隐式特征向量组合之后的特征向量为δ1,δ2,……,δn,每个特征向量的维度分别是m维;假设对应的权重向量为w=(w1,w2,……,wm),用户对物品的点击顺序向量是η=(t1,t2,……,tn),其中ti代表第i个物品的点击顺序;假定该向量为增序,则不断调整权重向量W,使得:
δ1W<δ2W<……<δnW
从而查询新物品时inew,通过计算δnewW可以得到物品的重要性。
CN201910276489.8A 2019-04-08 2019-04-08 一种用于物联网物品信息搜索排序的重要性评估方法 Active CN109885644B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910276489.8A CN109885644B (zh) 2019-04-08 2019-04-08 一种用于物联网物品信息搜索排序的重要性评估方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910276489.8A CN109885644B (zh) 2019-04-08 2019-04-08 一种用于物联网物品信息搜索排序的重要性评估方法

Publications (2)

Publication Number Publication Date
CN109885644A CN109885644A (zh) 2019-06-14
CN109885644B true CN109885644B (zh) 2021-04-06

Family

ID=66936370

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910276489.8A Active CN109885644B (zh) 2019-04-08 2019-04-08 一种用于物联网物品信息搜索排序的重要性评估方法

Country Status (1)

Country Link
CN (1) CN109885644B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110598062A (zh) * 2019-09-24 2019-12-20 支付宝(杭州)信息技术有限公司 一种数据资产的重要度量化方法、装置及电子设备
CN115016873A (zh) * 2022-05-05 2022-09-06 上海乾臻信息科技有限公司 前端数据交互方法、系统、电子设备及可读存储介质

Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102682074A (zh) * 2012-03-09 2012-09-19 浙江大学 一种基于流形学习的产品隐式属性识别方法
CN103400286A (zh) * 2013-08-02 2013-11-20 世纪禾光科技发展(北京)有限公司 一种基于用户行为进行物品特征标注的推荐系统及方法
CN104794207A (zh) * 2015-04-23 2015-07-22 山东大学 一种基于协作的推荐系统及其工作方法
US9270936B2 (en) * 2011-02-02 2016-02-23 Microsoft Technology Licensing, Llc Functionality for indicating direction of attention
CN107025277A (zh) * 2017-03-27 2017-08-08 华南理工大学 一种用户隐式反馈的量化评分方法
CN108427752A (zh) * 2018-03-13 2018-08-21 浙江大学城市学院 一种基于异构物品使用事件的物品语意标注方法
CN108460619A (zh) * 2018-01-16 2018-08-28 杭州电子科技大学 一种融合显隐式反馈的协同推荐模型

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9270936B2 (en) * 2011-02-02 2016-02-23 Microsoft Technology Licensing, Llc Functionality for indicating direction of attention
CN102682074A (zh) * 2012-03-09 2012-09-19 浙江大学 一种基于流形学习的产品隐式属性识别方法
CN103400286A (zh) * 2013-08-02 2013-11-20 世纪禾光科技发展(北京)有限公司 一种基于用户行为进行物品特征标注的推荐系统及方法
CN104794207A (zh) * 2015-04-23 2015-07-22 山东大学 一种基于协作的推荐系统及其工作方法
CN107025277A (zh) * 2017-03-27 2017-08-08 华南理工大学 一种用户隐式反馈的量化评分方法
CN108460619A (zh) * 2018-01-16 2018-08-28 杭州电子科技大学 一种融合显隐式反馈的协同推荐模型
CN108427752A (zh) * 2018-03-13 2018-08-21 浙江大学城市学院 一种基于异构物品使用事件的物品语意标注方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
协同过滤推荐系统中的关键算法研究;刘强;《中国优秀硕士学位论文全文数据库 信息科技辑》;20140115;第I138-2319页 *

Also Published As

Publication number Publication date
CN109885644A (zh) 2019-06-14

Similar Documents

Publication Publication Date Title
CN110704743B (zh) 一种基于知识图谱的语义搜索方法及装置
CN101587478B (zh) 图像训练、自动标注、检索方法及装置
CN103853831B (zh) 一种基于用户兴趣的个性化搜索实现方法
CN103116657B (zh) 一种网络教学资源的个性化搜索方法
CN106296312A (zh) 基于社交媒体的在线教育资源推荐系统
CN104615687A (zh) 一种面向知识库更新的实体细粒度分类方法与系统
CN102646122B (zh) 一种学术社交网络的自动构建方法
CN103593417A (zh) 基于关联规则预测的协同过滤推荐方法
CN106845644A (zh) 一种通过相互关系学习用户及移动应用的联系的异构网络
CN113422761B (zh) 基于对抗学习的恶意社交用户检测方法
Sha et al. A user requirement oriented web service discovery approach based on logic and threshold petri net
CN114265986B (zh) 一种融合知识图谱结构与路径语义的信息推送方法和系统
CN105760443A (zh) 项目推荐系统、项目推荐装置以及项目推荐方法
CN109885644B (zh) 一种用于物联网物品信息搜索排序的重要性评估方法
Bagci et al. Random walk based context-aware activity recommendation for location based social networks
JP2016051460A (ja) コンテキストアウェアネスに基づくユーザ関心情報サービスを提供するための状況認識オントロジー実現方法
CN115687760A (zh) 一种基于图神经网络的用户学习兴趣标签预测方法
Shafik et al. Recommendation system comparative analysis: internet of things aided networks
Gamgne Domgue et al. Community structure extraction in directed network using triads
Wang et al. A new method for measuring topological structure similarity between complex trajectories
CN110020228A (zh) 一种用于物联网物品信息搜索排序的相关性评估方法
Shemshadi et al. Ecs: A framework for diversified and relevant search in the internet of things
Zhao et al. Service objective evaluation via exploring social users' rating behaviors
Wang et al. High-performance social networking: microblog community detection based on efficient interactive characteristic clustering
Thi et al. Link prediction in social networks based on local weighted paths

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20220713

Address after: 310015 No. 51, Huzhou street, Hangzhou, Zhejiang

Patentee after: Zhejiang University City College

Address before: 310015 No. 50 Huzhou Street, Hangzhou City, Zhejiang Province

Patentee before: Zhejiang University City College