CN103412903B - 基于兴趣对象预测的物联网实时搜索方法及系统 - Google Patents

基于兴趣对象预测的物联网实时搜索方法及系统 Download PDF

Info

Publication number
CN103412903B
CN103412903B CN201310329763.6A CN201310329763A CN103412903B CN 103412903 B CN103412903 B CN 103412903B CN 201310329763 A CN201310329763 A CN 201310329763A CN 103412903 B CN103412903 B CN 103412903B
Authority
CN
China
Prior art keywords
interest
outcome
metadata
metadatabase
predicted
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN201310329763.6A
Other languages
English (en)
Other versions
CN103412903A (zh
Inventor
刘元安
范美
吴帆
张洪光
唐碧华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WUXI ANTUOSI TECHNOLOGY Co Ltd
Original Assignee
WUXI ANTUOSI TECHNOLOGY Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WUXI ANTUOSI TECHNOLOGY Co Ltd filed Critical WUXI ANTUOSI TECHNOLOGY Co Ltd
Priority to CN201310329763.6A priority Critical patent/CN103412903B/zh
Publication of CN103412903A publication Critical patent/CN103412903A/zh
Application granted granted Critical
Publication of CN103412903B publication Critical patent/CN103412903B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Abstract

本发明提供一种基于兴趣对象预测的物联网实时搜索方法及系统,包括:对兴趣对象进行原始数据的采集,对原始数据进行属性分析,并根据属性生成元数据库;根据所述元数据库,分析兴趣对象的周期状态,根据周期状态对兴趣对象的未来状态进行预测;获取兴趣对象的查询请求,将查询请求与兴趣对象的未来状态信息进行匹配,获得预测结果,并对预测结果进行验真,得到最终结果输出。通过对兴趣对象进行原始数据的采集生成元数据库,按照周期状态建立兴趣对象预测模型,针对用户的一次查询,通过将搜索词与伪动态索引库进行匹配,得到预测结果并对预测结果进行验真与反馈,通过上述过程实现了对物联网高动态性数据的实时搜索。

Description

基于兴趣对象预测的物联网实时搜索方法及系统
技术领域
本发明涉及网络信息检索领域,特别涉及一种基于兴趣对象预测的物联网实时搜索方法及系统。
背景技术
目前的网络搜索技术主要体现在互联网领域,其搜索的兴趣对象为网络或预存式非结构化内容,如文档、图片、音乐等;而在物联网领域,搜索的对象可以是具体的物体或人等物理实体,也可以是某些服务或状态等抽象实体,这些实体在形式和数量上都呈现出更繁复的特征。同时,这些实体信息往往不能从单一物联网设备或物理实体中直接获得,需要多个物联网设备和物理实体共同提供相应的数据。其次,物联网搜索具有更强的时空性和高动态性。物联网信息来源和可能为网络用户提供的服务主要由网络实体从物理世界中感知抽取并自动生成,物联网搜索的兴趣对象匹配和筛选与搜索内容的时间性、区域性关系密切,如空闲的办公室、通畅的道路信息、火车上的空位数量等信息都只有在查询的当时或下一时刻才有价值。此外,物联网网络终端不同于资源丰富的PC终端,存储资源、能量及通信能力均受限,应当避免节点间频繁的通信及复杂的指令处理操作,这对搜索过程的交互行为与通信量限制提出了更高的要求。
现有的物联网实时搜索技术和系统针对传感器本身的搜索提出了一种基于传感器相关属性值相似度计算的方法来实现物联网中的传感器搜索服务。对于一个给定的传感器,根据设计的算法计算与其他传感器间的相似度,之后根据相似度得分产生一组模糊集,最后利用得分对匹配条件的结果集进行排序。
在搜索过程中计算检索与资源间的相似度时,借用互联网搜索引 擎的工作模式,将检索与索引库中的资源进行相似度匹配计算,而索引库是针对之前某时刻爬取到的资源信息创建的。忽略了资源实时高动态变化的特征,因而无法保证数据的实时性。
发明内容
(一)解决的技术问题
本发明解决的技术问题是:如何解决现有的物联网搜索资源实时高动态变化特征所带来的时效性问题。
(二)技术方案
为解决上述问题,本发明实施例一种基于兴趣对象预测的物联网实时搜索方法,包括:
对兴趣对象进行原始数据的采集,对所述原始数据进行属性分析,并根据所述兴趣对象的属性建立元数据库;
根据所述元数据库,分析所述兴趣对象的周期状态,根据所述兴趣对象的周期状态对所述兴趣对象的未来状态进行预测,得到所述兴趣对象未来状态信息;
获取所述兴趣对象的查询请求,将所述查询请求与所述兴趣对象的未来状态信息进行匹配,获得预测结果,并对所述预测结果进行验真,得到最终结果,并将所述最终结果输出。
优选地,所述根据所述兴趣对象的属性建立元数据库包括:
根据所述兴趣对象的属性,分别为每类兴趣对象设计元数据;
根据所述兴趣对象中所述原始数据的属性以及属性对应的所述兴趣对象的状态信息,建立元数据与实体信息的映射关系;
根据所述元数据与实体信息数据的映射关系生成所述兴趣对象的元数据库。
优选地,所述根据所述兴趣对象的属性生成元数据库进一步包括:
建立心跳机制,并根据所述心跳机制更新元数据库中的元数据;
对元数据的历史信息和变化状态进行记录,利用记录的所述元数 据的历史信息和变化状态分析所述兴趣对象的周期状态。
优选地,所述根据所述元数据库,分析兴趣对象的周期状态,根据所述兴趣对象的周期状态对所述兴趣对象的未来状态进行预测,得到所述兴趣对象未来状态信息进一步包括:
根据所述兴趣对象的周期状态生成所述兴趣对象对应的系统时间窗,并利用所述兴趣对象对应的系统时间窗对所述兴趣对象的未来状态进行预测;
建立更新机制,当所述元数据库中的元数据发生更新时,则利用所述更新机制对所述兴趣对象的未来状态进行更新。
优选地,所述获取所述兴趣对象的查询请求,将所述查询请求与所述兴趣对象的未来状态信息进行匹配,获得预测结果包括:
对所述兴趣对象的未来状态信息建立索引,根据所述兴趣对象的未来状态信息的索引生成伪动态索引库;
计算所述伪动态索引库中所述兴趣对象的未来状态信息与查询请求的相似度,将相似度大于预设的门限值的兴趣对象根据降序排列算法进行降序排列,得到所述兴趣对象的预测结果。
优选地,所述对预测结果进行验真包括:
根据元数据与实体信息数据的映射关系,获取前预设值个兴趣对象对应的数据采集器采集的真实值,并判断预测结果是否与兴趣对象的真实值相匹配;
将相匹配的预测结果进行二次降序排序,并将排序结果作为最终结果输出;
所述将最终结果输出进一步包括:
将所述最终结果进行反馈,并根据反馈对所述降序排列算法进行修正。
本发明实施例还提供了一种基于兴趣对象预测的物联网实时搜索系统,包括:
元数据库,用于对兴趣对象进行原始数据的采集,并对所述原始 数据进行属性分析;所述元数据还包括所述兴趣对象的元数据与实体信息数据的映射关系;
兴趣对象预测模型,用于根据所述元数据库,分析所述兴趣对象的周期状态,根据所述兴趣对象的周期状态对所述兴趣对象的未来状态进行预测;
验真模块,用于对获取到的所述兴趣对象的查询请求与所述兴趣对象的未来状态信息进行匹配,并将得到的预测结果进行验真并将最终结果输出。
优选地,所述元数据库包括:
元数据库生成模块,用于根据所述兴趣对象的属性,分别为每类兴趣对象设计元数据,根据所述兴趣对象中所述原始数据的属性以及属性对应的所述兴趣对象的状态信息,建立元数据与实体信息的映射关系,根据所述元数据与实体信息数据的映射关系生成所述兴趣对象的元数据库;
元数据管理子系统,用于建立心跳机制,并根据所述心跳机制更新元数据库中的原始据;
元数据日志记录系统,用于对元数据库中的元数据的历史信息和变化状态进行记录。
优选地,所述兴趣对象预测模型包括:
系统时间窗模块,用于根据所述兴趣对象的周期状态生成所述兴趣对象对应的系统时间窗,并利用所述兴趣对象对应的系统时间窗对所述兴趣对象的未来状态进行预测;
伪动态索引库,用于保存所述兴趣对象的未来状态信息的索引;
计算模块,用于计算所述伪动态索引库中所述兴趣对象的未来状态信息与查询请求的相似度;
降序排列子模块,用于将相似度大于预设的门限值的兴趣对象根据降序排列算法进行降序排列;
更新模块,用于建立更新机制,当所述元数据库中的元数据发生 更新时,利用所述更新机制对所述兴趣对象预测模型中的所述兴趣对象的未来状态进行更新。
优选地,所述验真模块包括:
判断子模块,用于根据元数据与实体信息数据的映射关系,访问前预设值个兴趣对象对应的预测结果,并判断预测结果是否与兴趣对象的真实值相匹配;
二次降序排列子模块,用于将相匹配的预测结果进行二次降序排列,并将排序结果作为最终结果输出;
修正模块,用于将所述最终结果进行反馈,并修正所述降序排列子模块中的降序排列算法。
(三)有益效果
本发明实施例通过提供一种基于兴趣对象预测的物联网实时搜索方法及系统,对兴趣对象进行原始数据的采集生成元数据库,按照周期状态建立兴趣对象预测模型,针对用户的一次查询,通过将搜索词与伪动态索引库进行匹配,得到预测结果并对预测结果进行验真与反馈,通过上述过程实现了对物联网高动态性数据的实时搜索。
附图说明
图1是本发明实施例提供的方法流程图;
图2是本发明实施例提供的具体方法流程图;
图3是本发明实施例提供的系统结构示意图。
具体实施方式
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
实施例1:
现实世界的物理实体具有位置区域属性,有时对实体的搜索查询是针对某地区或某个与查询主体相关的实体,同时物联网中的很多自主生产数据及综合状态信息几乎时时刻刻发生着变化,如室温、车流、对象占用情况等。针对这些时刻动态变化的实体数据,如果采用传统的针对静态/准静态预存式非结构化内容和网页的搜索流程和索引方法,在兴趣对象查询时获得的搜索信息将是过期的、失效的信息。
因此,本发明实施例提供了一种基于兴趣对象预测的物联网实时搜索方法,如图1所示为本发明实施例提供的方法流程图,包括:
S1:对兴趣对象进行原始数据的采集,对所述原始数据进行属性分析,并根据所述兴趣对象的属性建立元数据库;
S2:根据所述元数据库,分析所述兴趣对象的周期状态,根据所述兴趣对象的周期状态对所述兴趣对象的未来状态进行预测,得到所述兴趣对象未来状态信息;
S3:获取所述兴趣对象的查询请求,将所述查询请求与所述兴趣对象的未来状态信息进行匹配,获得预测结果,并对所述预测结果进行验真,得到最终结果,并将所述最终结果输出。
本发明实施例提供的基于兴趣对象预测的物联网实时搜索方法,当对物联网进行实时搜索时,元数据库搜索兴趣对象的原始数据,并保存原始数据的属性,根据兴趣对象的原始数据的属性分析兴趣对象的周期状态,对兴趣对象的未来状态进行预测,并对预测结果进行验真,得到查询的最终结果。通过上述技术方案,实现了对物联网海量以及高动态性数据的实时搜索,降低了系统的开销,推动了物联网搜索服务研究的创新。
当对兴趣对象进行查询时,需要获取兴趣对象的实体信息数据,因此生成的元数据库中需要建立元数据与实体信息数据的映射关系,根据兴趣对象的属性分别为每类兴趣对象设计元数据,根据兴趣对象中原始数据的属性和兴趣对象的元数据,来建立元数据与实体信息数据的映射关系,并根据元数据与实体信息数据的映射关系建立兴趣对 象的元数据库。根据映射关系进行实体信息数据查询,使得查询过程更加迅速,实现了物联网搜索的实时性。
为了保证物联网搜索的实时性以及保证搜索信息的时效性,元数据库中的元数据需要定时的更新,因此需要建立心跳机制,根据心跳机制更新元数据库中的元数据;元数据库中进一步包括对元数据的历史信息和变化状态进行记录,保证服务器与用户之间的交互被完全记录,方便元数据信息从错误中的恢复,完成对元数据的动态管理。
对于根据元数据库分析兴趣对象的周期状态,并根据分析得到的兴趣对象的周期状态生成兴趣对象对应的系统时间窗,根据兴趣对象对应的系统时间窗对兴趣对象的未来状态进行预测。通过系统时间窗对兴趣对象的预测数据进行搜索,极大地的减少了物联网搜索的时间,保证了获得兴趣对象最新数据的实时可用性。对于对兴趣对象的未来状态进行预测,也要保证预测结果的实时性,因此需要建立更新机制,当元数据库中的元数据发生更新时,利用更新机制对兴趣对象的未来状态进行更新。
对所述兴趣对象的未来状态信息建立索引,根据所述兴趣对象的未来状态信息的索引生成伪动态索引库;计算所述伪动态索引库中所述兴趣对象的未来状态信息与查询请求的相似度,将相似度大于预设的门限值的兴趣对象根据降序排列算法进行降序排列,得到所述兴趣对象的预测结果。保证了物联网实时搜索的准确性。
由于兴趣对象预测技术根据查询请求与兴趣对象的未来状态信息进行匹配,得到的预测结果的可靠性和准确性较低,因此需要对预测结果进行验真,根据元数据与实体信息数据的映射关系,获取前预设值个兴趣对象对应的数据采集器采集的真实值,并判断预测结果是否与兴趣对象的真实值相匹配;将相匹配的预测结果进行二次降序排序,并将排序结果作为最终结果输出。从而提高了物联网搜索的运行效率,以及保证了物联网搜索的预测结果的准确性和可靠性。
根据上述技术方案,本发明实施例提供了一种物联网实时搜索方 法的具体实施例,如图2所示,包括:
步骤101:对兴趣对象进行原始数据的采集,对原始数据进行属性分析;
感知层通过传感器群、RFID群、二维条码等设备感知物理世界,采集兴趣对象的原始数据;
对兴趣对象的原始数据进行属性分析与建模,其中,原始数据的属性包括温湿度、声音、密度等,面对原始数据的松散异构形式,进行格式化处理与存储,为物联网搜索服务提供易于搜索的数据形态。
例如,对某个教室是否被占用进行采集,利用设置在该教室各个角落的传感器进行采集,采集的原始数据为该教室内的温度、教室门口的红外线和换气扇是否打开等,采集到该教室的原始数据后,对原始数据进行属性分析。
步骤102:根据兴趣对象的属性,分别为每类兴趣对象设计元数据;
根据物联网搜索服务的特点,结合互联网搜索的,考虑网页格式的元数据模型方案,根据物联网中的兴趣对象的属性,分别为每类兴趣对象设计元数据。
步骤103:根据该兴趣对象的原始数据的属性以及属性对应的所述兴趣对象的状态信息,建立元数据与实体信息数据的映射关系;
其中,该映射关系可以是一对一,更多的是一对多,或多对多。
步骤104:根据兴趣对象的元数据与实体信息数据的映射关系,以及根据搜索系统的结构生成兴趣对象的元数据库;
结合搜索服务特点进行元数据模型的建模,以潜在的搜索类型作为模型划分,以结构化的网页形式作为参考建立元数据模型群,生成搜索对象的元数据库,为之后的兴趣对象预测模型提供数据源。
其中,元数据库还包括,建立面向物联网实时搜索的元数据管理子系统,对元数据库中的元数据进行统一命名和管理,并维护搜索空间内统一的文件名,使元数据文件拥有全局唯一的名字,避免在命名空间内发生命名冲突。
元数据库还包括:在物联网实时搜索服务的运行过程中,需要通过元数据管理子系统建立心跳机制,根据心跳机制更新元数据库中的元数据,保存元数据服务的同步性和统一性。
元数据库还包括:建立元数据日志记录系统,记录元数据的历史信息及变化状态,利用记录的所述元数据的历史信息和变化状态分析所述兴趣对象的周期状态,为之后的兴趣对象预测模型的建立提供数据依据,保证服务器与用户之间的交互被完全记录,方便元数据信息从错误中的恢复,完成对元数据的动态管理。
步骤105:根据兴趣对象的元数据库分析兴趣对象的周期状态,并根据兴趣对象的周期状态,生成兴趣对象对应的系统时间窗,并根据兴趣对象对应的系统时间窗建立对兴趣对象的未来状态进行预测的兴趣对象预测模型;
根据兴趣对象的元数据,对兴趣对象的规律性进行分析,创建一个类通过数据采集器的历史行为和状态识别自身周期模式,获得数据采集器输出的兴趣对象的周期状态和系统时间窗,通过数学建模模拟输出兴趣对象的信息值与时间的函数关系,并根据函数关系变化情况综合分析搜索用户需求的基础上分别建立兴趣对象预测模型。
在兴趣对象预测模型中建立更新机制,根据系统时间窗进行周期性的检测并对相应的兴趣对象预测模型进行更新、维护,当所述元数据库中的元数据发生更新时,则利用所述更新机制对所述兴趣对象的未来状态进行更新。
步骤106:根据兴趣对象预测模型预测的兴趣对象的未来状态信息,对兴趣对象的未来状态信息建立索引,根据兴趣对象的未来状态信息的索引以及在搜索过程中通过自然语言处理等搜索技术建立伪动态索引库;
其中,伪动态索引库为在查询过程处理模块中建立伪动态索引提供了技术支持和数据支撑。
步骤107:获取到兴趣对象的查询请求,将该查询请求与兴趣对象 的未来状态信息进行匹配;
检索器将用户的查询请求进行处理,该处理包括传统检索中的中文分词、语义标注、去歧义等,运用TF-TDF模型计算查询词的词条权值得到查询特征词向量输入到索引器,与伪动态索引库中的兴趣对象的未来状态信息进行匹配计算,使用向量空间模型计算查询特征词向量与索引库中文档向量间的夹角余弦值从而获得检索与伪索引库中资源的相似度值。
上述的向量空间模型是将文档映射为一个特征向量V(d)=(t1,ω1(d);…;tn,ωn(d)),其中ti(i=1,2,…,n)为一列互不雷同的词条项,ωi(d)为ti在d中的权值,一般被定义为ti在d中出现频率tfi(d)的函数,即
TF-IDF函数是在信息检索系统中常用的词条权值计算方法,设N为所有文档的数目,ni为含有词条ti的文档数目。TF-IDF公式可以表达为下式:
从上述公式可知,当文档集中包含某一词条的文档越多,说明它区分文档类别属性的能力越低,其权值越小;而某一文档中某一词条出现的频率越高,说明它区分文档内容属性的能力越强,其权值越大。两文档间的相似度可以用其对应的向量之间的夹角余弦来表示,即文档di,dj的相似度可以表示为:
步骤108:计算伪动态索引库中兴趣对象未来状态信息与查询的匹配值,将匹配值大于预设的门限值的兴趣对象根据降序排列算法进行降序排列,得到预测结果;
此处的匹配是指语义上的相似度值大于门限值的模糊匹配,当然也可以对其进行具体传感器状态的完全匹配操作,取决于用户递交的检索和需求;
步骤109:对预测结果进行验真处理,将处理后的最终结果输出;
根据元数据与实体信息数据的映射关系,获取前预设值个兴趣对象对应的数据采集器采集的真实值,并判断预测结果是否与兴趣对象的真实值相匹配;
将相匹配的预测结果根据相关度算法进行二次降序排序,并将排序结果作为最终结果输出。
步骤110:将最终结果进行反馈,根据反馈对降序排列算法进行修正。
根据最终结果的偏差情况,对搜索结果预处理排序算法进行反馈,得到修正的算法,在下一轮查询时根据修正后的算法进行计算,提供了预测结果的准确率。
如果预测结果与真实值一致,但该预测结果在降序排列中的排名靠后,则降序排列算法将在下一次搜索过程中提升该预测结果的排名;当预测结果与真实值不一致,但该预测结果在降序排列中的排名靠前时,则降序排列算法将适当的选取函数修正搜索结果分值,在下一次搜索过程中降低该预测结果的排名。
本发明实施例通过提供一种基于兴趣对象预测的物联网实时搜索方法及系统,对兴趣对象进行原始数据的采集生成元数据库,按照周期状态建立兴趣对象预测模型,针对用户的一次查询,通过将搜索词与伪动态索引库进行匹配,得到预测结果并对预测结果进行验真与反馈,通过上述过程实现了对物联网高动态性数据的实时搜索。
实施例2:
本发明实施例还提供了一种基于兴趣对象预测的物联网实时搜索系统,如图3所示,包括:
元数据库,用于对兴趣对象进行原始数据的采集,并对所述原始 数据进行属性分析;所述元数据还包括所述兴趣对象的元数据与实体信息数据的映射关系;
所述元数据库包括:
元数据库生成模块,用于根据所述兴趣对象的属性,分别为每类兴趣对象设计元数据,根据所述兴趣对象中所述原始数据的属性以及属性对应的所述兴趣对象的状态信息,建立元数据与实体信息的映射关系,根据所述元数据与实体信息数据的映射关系生成所述兴趣对象的元数据库;
元数据管理子系统,用于建立心跳机制,并根据所述心跳机制更新元数据库中的原始据;
元数据日志记录系统,用于对元数据库中的元数据的历史信息和变化状态进行记录;
兴趣对象预测模型,用于根据所述元数据库,分析所述兴趣对象的周期状态,根据所述兴趣对象的周期状态对所述兴趣对象的未来状态进行预测;
所述兴趣对象预测模型包括:
系统时间窗模块,用于根据所述兴趣对象的周期状态生成所述兴趣对象对应的系统时间窗,并利用所述兴趣对象对应的系统时间窗对所述兴趣对象的未来状态进行预测;
伪动态索引库,用于保存所述兴趣对象的未来状态信息的索引;
计算模块,用于计算所述伪动态索引库中所述兴趣对象的未来状态信息与查询请求的相似度;
降序排列子模块,用于将相似度大于预设的门限值的兴趣对象根据降序排列算法进行降序排列;
更新模块,用于建立更新机制,当所述元数据库中的元数据发生更新时,利用所述更新机制对所述兴趣对象预测模型中的所述兴趣对象的未来状态进行更新。
验真模块,用于对获取到的所述兴趣对象的查询请求与所述兴趣 对象的未来状态信息进行匹配,并将得到的预测结果进行验真并将最终结果输出。
所述验真模块包括:
判断子模块,用于根据元数据与实体信息数据的映射关系,访问前预设值个兴趣对象对应的预测结果,并判断预测结果是否与兴趣对象的真实值相匹配;
二次降序排列子模块,用于将相匹配的预测结果进行二次降序排列,并将排序结果作为最终结果输出;
修正模块,用于将所述最终结果进行反馈,并修正所述降序排列子模块中的降序排列算法。
本发明实施例通过提供一种基于兴趣对象预测的物联网实时搜索装置,通过采集兴趣对象的原始数据,创建兴趣对象预测模型,对兴趣对象进行未来状态的预测,进而搜索兴趣对象的未来状态,利用成熟的互联网搜索技术,并引进预测结果验真环节,实现高效、便捷、易操作、人机友好交互的物联网实时信息搜索。
结合本发明公开的实施例描述的方法、算法以及系统框架,可以直接开发系统或者软件功能模块。系统或软件功能模块可以置于计算机、智能手机、车载电脑、或技术领域所公知的任意其他形式的智能终端中。
以上实施方式仅用于说明本发明,而并非对本发明的限制,有关技术领域的普通技术人员,在不脱离本发明的精神和范围的情况下,还可以做出各种变化和变型,因此所有等同的技术方案也属于本发明的范畴,本发明的专利保护范围应由权利要求限定。

Claims (7)

1.一种基于兴趣对象预测的物联网实时搜索方法,其特征在于,包括:
对兴趣对象进行原始数据的采集,对所述原始数据进行属性分析,并根据所述兴趣对象的属性建立元数据库;
根据所述元数据库,分析所述兴趣对象的周期状态,根据所述兴趣对象的周期状态对所述兴趣对象的未来状态进行预测,得到所述兴趣对象未来状态信息;
获取所述兴趣对象的查询请求,将所述查询请求与所述兴趣对象的未来状态信息进行匹配,获得预测结果,并对所述预测结果进行验真,得到最终结果,并将所述最终结果输出;
所述查询请求与所述兴趣对象的具体匹配过程为:检索器将用户的查询请求进行处理,该处理包括传统检索中的中文分词、语义标注、去歧义,运用TF-TDF模型计算查询词的词条权值得到查询特征词向量输入到索引器,与伪动态索引库中的兴趣对象的未来状态信息进行匹配计算,使用向量空间模型计算查询特征词向量与索引库中文档向量间的夹角余弦值从而获得检索与伪索引库中资源的相似度值;
所述根据所述兴趣对象的属性生成元数据库进一步包括:
建立心跳机制,并根据所述心跳机制更新元数据库中的元数据;
对元数据的历史信息和变化状态进行记录,利用记录的所述元数据的历史信息和变化状态分析所述兴趣对象的周期状态;
所述对预测结果进行验真包括:
根据元数据与实体信息数据的映射关系,获取前预设值个兴趣对象对应的数据采集器采集的真实值,并判断预测结果是否与兴趣对象的真实值相匹配;
将相匹配的预测结果进行二次降序排序,并将排序结果作为最终结果输出;如果预测结果与真实值一致,但该预测结果在降序排列中的排名靠后,则降序排列算法将在下一次搜索过程中提升该预测结果的排名;当预测结果与真实值不一致,但该预测结果在降序排列中的排名靠前时,则降序排列算法将适当的选取函数修正搜索结果分值,在下一次搜索过程中降低该预测结果的排名;
所述将最终结果输出进一步包括:
将所述最终结果进行反馈,并根据反馈对所述降序排列算法进行修正。
2.根据权利要求1所述的方法,其特征在于,所述根据所述兴趣对象的属性建立元数据库包括:
根据所述兴趣对象的属性,分别为每类兴趣对象设计元数据;
根据所述兴趣对象中所述原始数据的属性以及属性对应的所述兴趣对象的状态信息,建立元数据与实体信息的映射关系;
根据所述元数据与实体信息数据的映射关系生成所述兴趣对象的元数据库。
3.根据权利要求1所述的方法,其特征在于,所述根据所述元数据库,分析兴趣对象的周期状态,根据所述兴趣对象的周期状态对所述兴趣对象的未来状态进行预测,得到所述兴趣对象未来状态信息进一步包括:
根据所述兴趣对象的周期状态生成所述兴趣对象对应的系统时间窗,并利用所述兴趣对象对应的系统时间窗对所述兴趣对象的未来状态进行预测;
建立更新机制,当所述元数据库中的元数据发生更新时,则利用所述更新机制对所述兴趣对象的未来状态进行更新。
4.根据权利要求1所述的方法,其特征在于,所述获取所述兴趣对象的查询请求,将所述查询请求与所述兴趣对象的未来状态信息进行匹配,获得预测结果包括:
对所述兴趣对象的未来状态信息建立索引,根据所述兴趣对象的未来状态信息的索引生成伪动态索引库;
计算所述伪动态索引库中所述兴趣对象的未来状态信息与查询请求的相似度,将相似度大于预设的门限值的兴趣对象根据降序排列算法进行降序排列,得到所述兴趣对象的预测结果。
5.一种基于兴趣对象预测的物联网实时搜索系统,其特征在于,包括:
元数据库,用于对兴趣对象进行原始数据的采集,并对所述原始数据进行属性分析;所述元数据还包括所述兴趣对象的元数据与实体信息数据的映射关系;
兴趣对象预测模型,用于根据所述元数据库,分析所述兴趣对象的周期状态,根据所述兴趣对象的周期状态对所述兴趣对象的未来状态进行预测;
验真模块,用于对获取到的所述兴趣对象的查询请求与所述兴趣对象的未来状态信息进行匹配,并将得到的预测结果进行验真并将最终结果输出,其中的具体匹配过程为:检索器将用户的查询请求进行处理,该处理包括传统检索中的中文分词、语义标注、去歧义,运用TF-TDF模型计算查询词的词条权值得到查询特征词向量输入到索引器,与伪动态索引库中的兴趣对象的未来状态信息进行匹配计算,使用向量空间模型计算查询特征词向量与索引库中文档向量间的夹角余弦值从而获得检索与伪索引库中资源的相似度值;
其中,所述元数据库包括:
元数据管理子系统,用于建立心跳机制,并根据所述心跳机制更新元数据库中的原始据;
元数据日志记录系统,用于对元数据库中的元数据的历史信息和变化状态进行记录;
所述验真模块包括:
判断子模块,用于根据元数据与实体信息数据的映射关系,访问前预设值个兴趣对象对应的预测结果,并判断预测结果是否与兴趣对象的真实值相匹配;
二次降序排列子模块,用于将相匹配的预测结果进行二次降序排列,并将排序结果作为最终结果输出;如果预测结果与真实值一致,但该预测结果在降序排列中的排名靠后,则降序排列算法将在下一次搜索过程中提升该预测结果的排名;当预测结果与真实值不一致,但该预测结果在降序排列中的排名靠前时,则降序排列算法将适当的选取函数修正搜索结果分值,在下一次搜索过程中降低该预测结果的排名;
修正模块,用于将所述最终结果进行反馈,并修正所述降序排列子模块中的降序排列算法。
6.根据权利要求5所述的系统,其特征在于,所述元数据库还包括:元数据库生成模块,用于根据所述兴趣对象的属性,分别为每类兴趣对象设计元数据,根据所述兴趣对象中所述原始数据的属性以及属性对应的所述兴趣对象的状态信息,建立元数据与实体信息的映射关系,根据所述元数据与实体信息数据的映射关系生成所述兴趣对象的元数据库。
7.根据权利要求5所述的系统,其特征在于,所述兴趣对象预测模型包括:
系统时间窗模块,用于根据所述兴趣对象的周期状态生成所述兴趣对象对应的系统时间窗,并利用所述兴趣对象对应的系统时间窗对所述兴趣对象的未来状态进行预测;
伪动态索引库,用于保存所述兴趣对象的未来状态信息的索引;
计算模块,用于计算所述伪动态索引库中所述兴趣对象的未来状态信息与查询请求的相似度;
降序排列子模块,用于将相似度大于预设的门限值的兴趣对象根据降序排列算法进行降序排列;
更新模块,用于建立更新机制,当所述元数据库中的元数据发生更新时,利用所述更新机制对所述兴趣对象预测模型中的所述兴趣对象的未来状态进行更新。
CN201310329763.6A 2013-07-31 2013-07-31 基于兴趣对象预测的物联网实时搜索方法及系统 Expired - Fee Related CN103412903B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201310329763.6A CN103412903B (zh) 2013-07-31 2013-07-31 基于兴趣对象预测的物联网实时搜索方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201310329763.6A CN103412903B (zh) 2013-07-31 2013-07-31 基于兴趣对象预测的物联网实时搜索方法及系统

Publications (2)

Publication Number Publication Date
CN103412903A CN103412903A (zh) 2013-11-27
CN103412903B true CN103412903B (zh) 2017-10-03

Family

ID=49605915

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201310329763.6A Expired - Fee Related CN103412903B (zh) 2013-07-31 2013-07-31 基于兴趣对象预测的物联网实时搜索方法及系统

Country Status (1)

Country Link
CN (1) CN103412903B (zh)

Families Citing this family (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103617253B (zh) * 2013-11-29 2018-01-30 百度在线网络技术(北京)有限公司 搜索方法、客户端和服务器
CN106919565B (zh) * 2015-12-24 2020-12-22 航天信息股份有限公司 一种基于MapReduce的文档检索方法及系统
CN107688604A (zh) * 2017-07-26 2018-02-13 阿里巴巴集团控股有限公司 数据应答处理方法、装置及服务器
CN108415818B (zh) * 2018-03-01 2020-03-27 山东大学 一种考虑繁忙程度的大数据平台多服务接口执行时间预测方法
CN112637273B (zh) * 2020-12-04 2022-08-02 重庆邮电大学 一种智能热点数据预测及缓存方法
CN112687267A (zh) * 2020-12-22 2021-04-20 同济大学 一种物联网数据语义处理系统
CN112749851B (zh) * 2021-01-20 2021-09-07 国网江苏省电力有限公司信息通信分公司 基于人工智能的大数据需求预测方法及大数据云服务中心

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102916985A (zh) * 2011-08-02 2013-02-06 天津中启创科技有限公司 数据采集管理系统的工作方法
CN102915346A (zh) * 2012-09-26 2013-02-06 中国科学院软件研究所 面向物联网智能感知的数据索引建立与查询方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102916985A (zh) * 2011-08-02 2013-02-06 天津中启创科技有限公司 数据采集管理系统的工作方法
CN102915346A (zh) * 2012-09-26 2013-02-06 中国科学院软件研究所 面向物联网智能感知的数据索引建立与查询方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
"面向物联网的实体实时搜索服务综述";王智等;《计算机应用研究》;20110630;第28卷(第6期);第2001-2005页 *

Also Published As

Publication number Publication date
CN103412903A (zh) 2013-11-27

Similar Documents

Publication Publication Date Title
CN103412903B (zh) 基于兴趣对象预测的物联网实时搜索方法及系统
Mehmood et al. Implementing big data lake for heterogeneous data sources
US9449271B2 (en) Classifying resources using a deep network
US9317613B2 (en) Large scale entity-specific resource classification
CN102890713B (zh) 一种基于用户当前地理位置和物理环境的音乐推荐方法
KR20210040891A (ko) 정보 추천 방법과 장치, 전자 장비, 컴퓨터 판독가능 저장 매체 및 컴퓨터 프로그램
CN104346438B (zh) 基于大数据数据管理服务系统
US20010044800A1 (en) Internet organizer
JP6216467B2 (ja) 視覚・意味複合ネットワーク、および当該ネットワークを形成するための方法
CN104850601B (zh) 基于图数据库的警务实时分析应用平台及其构建方法
CN103294815A (zh) 基于关键字分类并有多种呈现方式的搜索引擎装置与方法
CN111125460A (zh) 信息推荐方法及装置
CN103970891B (zh) 一种基于情境的用户兴趣信息查询方法
CN110019616A (zh) 一种poi现势状态获取方法及其设备、存储介质、服务器
CN114218400A (zh) 基于语义的数据湖查询系统及方法
CN102968465A (zh) 网络信息服务平台及其基于该平台的搜索服务方法
CN113254630B (zh) 一种面向全球综合观测成果的领域知识图谱推荐方法
CN109408578A (zh) 一种针对异构环境监测数据融合方法
CN112052387A (zh) 一种内容推荐方法、装置和计算机可读存储介质
Zhang Application of data mining technology in digital library.
CN111723256A (zh) 一种基于信息资源库的政务用户画像构建方法及其系统
Mythily et al. Clustering models for data stream mining
Li et al. Intelligent control system of smart home for context awareness
CN113010771A (zh) 搜索引擎中的个性化语义向量模型的训练方法及装置
CN110442614A (zh) 元数据的搜索方法及装置、电子设备、存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20171003

Termination date: 20190731

CF01 Termination of patent right due to non-payment of annual fee