CN107832319B - 一种基于语义关联网络的启发式查询扩展方法 - Google Patents

一种基于语义关联网络的启发式查询扩展方法 Download PDF

Info

Publication number
CN107832319B
CN107832319B CN201710468786.3A CN201710468786A CN107832319B CN 107832319 B CN107832319 B CN 107832319B CN 201710468786 A CN201710468786 A CN 201710468786A CN 107832319 B CN107832319 B CN 107832319B
Authority
CN
China
Prior art keywords
query
association
concept
weight
path
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710468786.3A
Other languages
English (en)
Other versions
CN107832319A (zh
Inventor
郭黎敏
李童
高需
苏醒
丁治明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Technology
Original Assignee
Beijing University of Technology
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Technology filed Critical Beijing University of Technology
Priority to CN201710468786.3A priority Critical patent/CN107832319B/zh
Publication of CN107832319A publication Critical patent/CN107832319A/zh
Application granted granted Critical
Publication of CN107832319B publication Critical patent/CN107832319B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Databases & Information Systems (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Data Mining & Analysis (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开一种基于语义关联网络的启发式查询扩展方法,其步骤为:1)在语料库的基础上,结合本体中抽取的概念,建立关联图;2)在所述关联图和查询的基础上,通过启发式查询扩展,得到关联语义上的扩展式查询。本发明可以保证查询扩展的合理性和准确性。该发明的最终结果可以提供给相关领域的用户使用,例如应急救援、图书推荐等领域,可以真实地反映用户需求的结果。

Description

一种基于语义关联网络的启发式查询扩展方法
技术领域
本发明属于信息查询技术领域,具体涉及一种基于语义关联网络的启发式查询扩展方法。
背景技术
随着信息通讯技术及其相关应用的飞速发展,各种来源的数据,如互联网网页数据、社交网络数据、移动通讯数据、交通数据、物联网采样数据等急剧膨胀,极大地改变了人们的生产与生活模式。传统的查询技术已经无法满足用户的检索需求,如何有效地利用这些数据进行查询服务,是研究者们面临的重大挑战之一。数据的查询除了简单的关键词查询、时空查询、数值查询之外,还包括更加复杂的启发式关联查询。通过关联语义得到启发式的扩展查询,可以为最终决策提供有力支持。因此启发式关联查询具有重要的研究价值与广阔的应用前景,如在应急救援领域中,实时查询某一灾害,可以衍生查询出类似灾害、救援方式、灾害区域附近的救援力量、医院分布情况等,为救援起积极指导作用;在图书查询系统中,通过用户输入的关键词,推荐类似书籍或作者的其他系列书籍等,更全面地满足用户需求;在电商推荐系统中,分析用户的购买数据,发现用户购物行为的关联关系,向其推荐感兴趣的商品。可以说,启发式关联查询技术已经得到了人们日益广泛的重视。
传统的信息检索技术根据查询关键词进行匹配检索,为文本集中每个词建立精确的定位并提供检索。全文检索是典型的信息检索系统,它允许用户从全文的任意结构中查找。查询扩展是在原始查询词的基础上,通过一定的方法和策略将与原查询词相关的扩展词添加到查询中,形成能更准确表达查询意图的新查询。总体上来说,查询扩展技术可以分为三类:基于全局与局部分析的查询扩展、基于查询日志的查询扩展和基于语义概念的查询扩展。第一类主要依据文档中词语之间的共现信息来发现其相似性,从而实现查询扩展;第二类是通过分析用户的查询日志,建立查询空间与文档空间之间的联系进行扩展;第三类是从语义概念层面上对查询进行扩展]
然而,传统的检索技术只能根据关键词进行匹配,忽略了语义在查询中的作用,无法实现关联式的启发查询。查询扩展方法从统计或语义的角度出发进行研究,但是都没有考虑时间因素,且忽略了扩展词之间的关联路径。启发式查询的合理定义与描述、语义关联网络的构建方法、启发式查询扩展方法等,没有得到有效的研究与解决,对这些关键技术问题有待进一步的研究。
发明内容
针对上述尚没有解决的关键问题,本发明提出了一种基于语义关联网络的启发式查询扩展方法,目的是为查询词进行语义扩展提供一种可行的解决方案,从而搜索出相关联的数据对象。
为实现上述目的,本发明采用如下的技术方案:
一种基于语义关联网络的启发式查询扩展方法包括以下步骤:
步骤1、根据本体中抽取的概念,建立关联图,其中,所述关联图用RG=(V,E)表示,V是节点的集合,
Figure GDA0001438387160000021
v是一个概念,用语义标签A表示;E是边的集合,
Figure GDA0001438387160000022
e=(vi,vj,rw)表示vi和vj之间有关联,且其关联权重为rw;所述查询用Q=(A1,A2,…,Am)表示,Ai表示第i个查询条件对应的概念;
步骤2、根据查询Q和关联图RG,构造最小查询生成树MQST,同时根据所述最小查询生成树MQST对查询中的节点进一步进行有效路径扩展。
作为优选,步骤1构建关联图的方法包括如下:
步骤1-1、从本体中抽取领域内的概念集AS,将概念集中的概念作为关联图的节点,并初始化各概念对之间的关联权重为0;
步骤1-2、抽取窗口Wd内的关联矩阵集合RMS’,并累加计算节点间的关联度的时间权重的加权和;
步骤1-3、计算节点间的关联权重,若存在关联,则添加关联图的边。
作为优选,步骤1-2所述关联矩阵的计算方法包括如下:
步骤1-2-1、从本体中抽取领域内的概念集AS,然后扫描文本集ST,查看每个概念是否在ST中出现,初始化统计矩阵OM,其中,所述文本集用ST=(st1,st2,…,stn)表示,统计矩阵OM记录概念是否在文本中出现,其中,行表示文本,列表示概念,OM[i,j]表示第j个概念是否在第i个文本中出现;
步骤1-2-2、逐个计算共现率和关联度,如果满足强关联条件,即共现率大于等于最小共现率且关联度大于等于最小关联度,将其保存在关联矩阵RM中,其中,在所述文本集ST=(st1,st2,…,stn)中,概念的A1和A2的共现率为
Figure GDA0001438387160000023
其中
Figure GDA0001438387160000024
表示A1和A2在sti中的共现情况;概念的A1和A2的关联度为
Figure GDA0001438387160000031
其中CP(A1,A2)是A1和A2在ST中的共现率,OP(Ai)是Ai在ST中出现的概率;统计矩阵RM记录概念之间的共现率和关联度,其中行、列表示概念,RM[i,j].cp表示第i个概念与第i个概念的共现率,RM[i,j].rp表示第i个概念与第i个概念的关联度。
作为优选,步骤1-2中所述统计窗口用Wd={tk-n,tk-n+1,…,tk}表示;时间权重WT(tl,tk)=1/2(tk-tl),其中tk为当前的时间段,tl(l≤k)为任一时间段;步骤1-3中所述概念对(Ai,Aj)的关联权重为
Figure GDA0001438387160000032
其中Wd为统计窗口,WT(tl,tk)为时间权重,RPtl(Ai,Aj)是Ai、Aj在时间段tl的关联度。
作为优选,,步骤2中所述最小查询生成树的构造方法包括如下:
步骤2-1、从查询Q中随机选择一个节点作为开始节点,并初始化最小查询生成树MQST的节点集合V’和边集合E’;
步骤2-2、对Q中的每一对概念(u,v),判断其是否路径可达,若可达,则在邻接表adj中保存可达节点,并使用矩阵M的M[u,v].sp和M[u,v].w分别保存RG中u、v之间的最短路径和其关联值;否则则分别设置为空和无穷大;
步骤2-3、初始化权重数组weight和小顶堆Heap;
步骤2-4、开始迭代计算,弹出堆Heap中weight最小的节点u,更新Q中u的每个路径可达节点v的weigh,保证其是v到MQST的最小关联值;
步骤2-5、调整堆并将该路径中的节点和边添加至集合V’和E’中,直至Heap为空,即Q中的节点全部添加至MQST中,迭代结束。
作为优选,步骤2-1所述关联图RG在查询Q下的查询生成树T满足:(1)T包含Q中的每一个节点;(2)T不包含环;(3)T是RG的一个连通子图;最小查询生成树MQST满足:W(MQST)=min{W(T)|T∈TS},其中TS={T1,T2,…,Tn}是满足RG和Q的所有查询生成树的集合。
作为优选,步骤2-2所述判断路径是否可达的方法是采用Dijkstra算法预先计算RG中所有节点对之间的最短路径,并保存起来,执行步骤2-2时可直接查看是否可达。
作为优选,步骤2-3所述权重weight[v]表示v到MQST的所有路径中的最小关联值;小顶堆Heap依据weight值构建并调整堆。
作为优选,步骤2-4所述路径P的关联值
Figure GDA0001438387160000033
其中rw(ei)是边ei的关联权重。
作为优选,步骤2中有效路径扩展方法包括如下:
步骤2-2-1、对查询Q=(v1,v2,…,vm)中每个节点vi进行有效路径扩展,其中,所述节点v的有效路径VP=(v’1,v’2,…,v’k)满足:(1)v等于有效路径VP的第一个节点v’1;(2)W(VP)小于等于给定关联阈值δ;(3)有效路径VP的长度k小于等于给定关联层级阈值τ;
步骤2-2-2、合并MQST和每个vi的有效路径VPSvi的节点,得到查询Q的启发式关联扩展查询Q’,即
Figure GDA0001438387160000041
本发明所采用的技术方案是两阶段框架,首先在语料库文本集的基础上,结合特定领域的本体中的概念集,构建语义标签关联关系网络;然后基于语义关联网络,分析查询关键词,通过启发式查询得到关联语义上的扩展式查询。
综合以上分析,本发明可以保证查询扩展的合理性和高准确性。该发明的最终结果可以提供给相关领域的用户使用,例如应急救援、图书推荐等领域,可以真实地反映用户需求的结果。
附图说明
图1为语义关联图RG的示意图;
图2为矩阵OM实例的示意图;
图3为矩阵RM实例的示意图;
图4为最小查询生成树MQST的构造;
图5为最短路径生成图实例的示意图;
图6为查询扩展实例的示意图;
图7(a)是扩展词个数与和最小共现率min_cp的关系图,图7(b)是扩展词个数与和最小关联度min_rp的关系图;
图8(a)是P@20与文档集规模大小NST的关系图,图8(b)是P@10与文档集规模大小NST的关系图,图8(c)是P@20与关联值阈值δ的关系图,图8(d)是P@10与关联值阈值δ的关系图,图8(e)是P@20与关联层级阈值τ的关系图,图8(f)是P@10与关联层级阈值τ的关系图;
图9(a)是不同查询的P@20与HQoSR、DQ的关系图,图9(b)是不同查询的P@10与HQoSR、DQ的关系图;
图10为本发明基于语义关联网络的启发式查询扩展方法的流程图。
具体实施方式
下面结合附图,通过实例进一步说明本发明,但不以任何方式限制本发明的范围。
如图10所示,本发明实施例提供一种基于语义关联网络的启发式查询扩展方法,其原理是:
在语料库的基础上,结合本体中抽取的概念,建立关联图。然后在关联图RG和查询Q的基础上,通过启发式查询扩展,得到关联语义上的扩展式查询。本发明中关联图RG=(V,E),V是节点的集合,
Figure GDA0001438387160000051
v是一个概念,用语义标签A表示;E是边的集合,
Figure GDA0001438387160000052
e=(vi,vj,rw)表示vi和vj之间有关联,且其关联权重为rw。图1给出了语义关联图RG的示意图。
所述语料库是指经科学取样和加工的大规模电子文本库;概念是指任何事务,它表示的是对象的集合,其定义包括概念的名称,与其他概念之间的关系的集合,以及用自然语言对概念的描述。本体是捕获相关的领域的知识,提供对该领域知识的共同理解,确定该领域内共同认可的词汇,并从不同层次的形式化模式上给出这些词汇和词汇之间相互关系的明确定义。
启发式查询扩展的具体过程包括:
第一步:每一个统计时刻,对当前计算和存储的关联矩阵集合RMS’,通过计算节点间的时间加权的关联权重,构造当前统计窗口的关联图,具体方法如下:
1.从本体中抽取领域内的概念集AS,将概念集中的概念作为关联图的节点,并初始化各概念对之间的关联权重为0。
2.计算当前时刻的关联矩阵RM,具体方法如下:
⑴从本体中抽取领域内的概念集AS,然后扫描文本集ST,查看每个概念是否在ST中出现,初始化统计矩阵OM,统计矩阵OM记录概念是否在文本中出现,其中行表示文本,列表示概念,OM[i,j]表示第j个概念是否在第i个文本中出现。表1为语料库中的文本集合实例。图2是以表1为例的统计矩阵OM实例。
表1.文本集合实例
文本 文本
编st<sub>1</sub>号 a,b,c,d,c,e,f,g
st<sub>2</sub> b,d,e,f,a,c,g
st<sub>3</sub> a,b,c,b,u,t,h,l
st<sub>4</sub> a,b,d,c,f,b,t,p,v,l
⑵逐个计算共现率和关联度,如果满足强关联条件,即共现率大于等于最小共现率且关联度大于等于最小关联度,将其保存在关联矩阵RM中。在文本集ST=(st1,st2,…,stn)中,概念的A1和A2的共现率为
Figure GDA0001438387160000053
其中
Figure GDA0001438387160000054
表示A1和A2在sti中的共现情况;概念的A1和A2的关联度为
Figure GDA0001438387160000061
其中CP(A1,A2)是A1和A2在ST中的共现率,OP(Ai)是Ai在ST中出现的概率;统计矩阵RM记录概念之间的共现率和关联度,其中行、列表示概念,RM[i,j].cp表示第i个概念与第i个概念的共现率,RM[i,j].rp表示第i个概念与第i个概念的关联度。图3是以表1为例的统计矩阵RM实例。
3.抽取统计窗口Wd内的关联矩阵集合RMS’,计算节点间的关联权重,若存在关联,则构造关联图的边。在统计窗口Wd={tk-n,tk-n+1,…,tk}内,概念对(Ai,Aj)的关联权重为
Figure GDA0001438387160000062
其中Wd为统计窗口,WT(tl,tk)为时间权重,
Figure GDA0001438387160000064
是Ai、Aj在时间段tl的关联度;时间权重WT(tl,tk)=1/2(tk-tl),其中tk为当前的时间段,tl(l≤k)为任一时间段。
第二步:根据第一步中得到的关联图RG,首先依据查询Q构造最小查询生成树MQST,关联图RG在查询Q下的查询生成树T满足:(1)T包含Q中的每一个节点;(2)T不包含环;(3)T是RG的一个连通子图;最小查询生成树MQST满足:W(MQST)=min{W(T)|T∈TS},其中TS={T1,T2,…,Tn}是满足RG和Q的所有查询生成树的集合。图5是最短路径生成图实例。然后再进一步对查询Q中的节点进行有效路径扩展。图6是查询扩展的实例。具体方法如下:
1.根据查询Q和关联图RG,构造最小查询生成树MQST,具体方法如下:
⑴从查询Q中随机选择一个节点作为开始节点,并初始化最小查询生成树MQST的节点集合V’和边集合E’。
⑵对Q中的每一对概念(u,v),判断其是否路径可达,若可达,则在邻接表adj中保存可达节点,并使用矩阵M的M[u,v].sp和M[u,v].w分别保存RG中u、v之间的最短路径和其关联值;否则则分别设置为空和无穷大。
⑶初始化权重数组weight和小顶堆Heap,weight[v]表示v到MQST的所有路径中的最小关联值;小顶堆Heap依据weight值构建并调整堆。
⑷开始迭代计算,弹出堆Heap中weight最小的节点u,更新Q中u的每个路径可达节点v的关联值weigh,保证其是v到MQST的最小关联值。路径P的关联值
Figure GDA0001438387160000063
其中rw(ei)是边ei的关联权重。
⑸调整堆并将该路径中的节点和边添加至集合V’和E’中,直至Heap为空,即Q中的节点全部添加至MQST中,迭代结束。以图1为例,假设Q=(G,H,N),迭代的过程中,最小查询生成树MQST的构造过程如图4所示。
2.在最小查询生成树MQST的基础上,对查询中的节点进一步进行有效路径扩展,具体方法如下:
⑴对查询Q=(v1,v2,…,vm)中每个节点vi进行有效路径扩展,节点v的有效路径VP=(v’1,v’2,…,v’k)满足:①v等于有效路径VP的第一个节点v’1;②W(VP)小于等于给定关联阈值δ;③有效路径VP的长度k小于等于给定关联层级阈值τ。
⑵合并MQST和每个vi的有效路径VPSvi的节点,得到查询Q的启发式关联扩展查询Q’,即
Figure GDA0001438387160000072
为了验证本发明的有效性和准确性,本发明设计了一些查询,并对这些查询使用本发明提出的方法进行查询扩展。表2给出了实验的查询列表。
表2.查询列表
Figure GDA0001438387160000071
本发明提出了一种基于语义关联网络的启发式查询扩展方法。与现有的查询扩展方法没有考虑时间因素且忽略了扩展词之间的关联路径相比,本发明具有如下优势:
(1)本发明提出了动态关联图,真实反映了用户的查询需求。如图7(a)—7(b)所示,图7(a),7(b)分别给出了扩展词个数与和最小共现率min_cp、最小关联度min_rp的关系图,说明了启发式查询扩展的合理性,其中纵坐标Number of Expansion Words表示扩展词个数,横坐标min_cp表示最小共现率,min_rp表示最小关联度。
(2)本发明提出了启发式查询扩展方法,提高了查询准确率。如图8(a)—8(f)所示,图8(a),8(b)是P@20和P@10与文档集规模大小NST的关系图,其中纵坐标P@k表示前k个检索结果中与查询相关的文档数,横坐标Number of ST表示文本集个数。8(c),8(d)是P@20和P@10与关联值阈值δ的关系图,其中纵坐标δ表示关联阈值,纵坐标P@k表示前k个检索结果中与查询相关的文档数。8(e),8(f)是P@20和P@10与关联层级阈值τ的关系图,其中纵坐标τ表示关联层级阈值,纵坐标P@k表示前k个检索结果中与查询相关的文档数。
(3)本发明对比了查询扩展后的结果和直接查询的结果,证明了有效性。如图9(a)—9(b)所示,图9(a),9(b)分别是不同查询的P@20和P@10与HQoSR、DQ的关系图,其中纵坐标P@k表示前k个检索结果中与查询相关的文档数,横坐标Q1-Q4表示不同查询。
综合以上分析,本发明可以保证扩展查询的合理性和准确性。该发明的最终结果可以提供给相关领域的用户使用,例如应急救援、图书推荐等领域,可以真实地反映用户需求的结果。
以上通过实施例对本发明进行了详细的描述,本领域的技术人员应当理解,在不超出本发明的精神和实质的范围内,对本发明做出一定的修改和变动,比如建立其他关联度统计方法,或者最小查询生成树构造方法,仍然可以实现本发明的目的。

Claims (7)

1.一种基于语义关联网络的启发式查询扩展方法,其特征在于,包括以下步骤:
步骤1、根据本体中抽取的概念,建立关联图,其中,所述关联图用RG=(V,E)表示,V是节点的集合,
Figure FDA0003178990800000011
v是一个概念,用语义标签A表示;E是边的集合,
Figure FDA0003178990800000012
e=(vi,vj,rw)表示vi和vj之间有关联,且其关联权重为rw;所述查询用Q=(A1,A2,…,Am)表示,Ai表示第i个查询条件对应的概念;
步骤2、根据查询Q和关联图RG,构造最小查询生成树MQST,同时根据所述最小查询生成树MQST对查询中的节点进一步进行有效路径扩展;
步骤1构建关联图的方法包括如下:
步骤1-1、从本体中抽取领域内的概念集AS,将概念集中的概念作为关联图的节点,并初始化各概念对之间的关联权重为0;
步骤1-2、抽取统计窗口Wd内的关联矩阵集合RMS’,并累加计算节点间的关联度的时间权重的加权和;
步骤1-3、计算节点间的关联权重,若存在关联,则添加关联图的边;
步骤1-2所述关联矩阵的计算方法包括如下:
步骤1-2-1、从本体中抽取领域内的概念集AS,然后扫描文本集ST,查看每个概念是否在ST中出现,初始化统计矩阵OM,其中,所述文本集用ST=(st1,st2,…,stn)表示,统计矩阵OM记录概念是否在文本中出现,其中,行表示文本,列表示概念,OM[i,j]表示第j个概念是否在第i个文本中出现;
步骤1-2-2、逐个计算共现率和关联度,如果满足强关联条件,即共现率大于等于最小共现率且关联度大于等于最小关联度,将其保存在关联矩阵RM中,其中,在所述文本集ST=(st1,st2,…,stn)中,概念的A1和A2的共现率为
Figure FDA0003178990800000013
其中
Figure FDA0003178990800000014
表示A1和A2在sti中的共现情况;概念的A1和A2的关联度为
Figure FDA0003178990800000015
其中CP(A1,A2)是A1和A2在ST中的共现率,OP(Ai)是Ai在ST中出现的概率;统计矩阵RM记录概念之间的共现率和关联度,其中行、列表示概念,RM[i,j].cp表示第i个概念与第j个概念的共现率,RM[i,j].rp表示第i个概念与第j个概念的关联度;
步骤1-2中所述统计窗口用Wd={tk-n,tk-n+1,…,tk}表示;时间权重WT(tl,tk)=1/2(tk -tl),其中tk为当前的时间段,tl(l≤k)为任一时间段;
步骤1-3中所述概念对(Ai,Aj)的关联权重为
Figure FDA0003178990800000021
其中Wd为统计窗口,WT(tl,tk)为时间权重,
Figure FDA0003178990800000022
是Ai、Aj在时间段tl的关联度。
2.如权利要求1所述的基于语义关联网络的启发式查询扩展方法,其特征在于,步骤2中所述最小查询生成树的构造方法包括如下:
步骤2-1、从查询Q中随机选择一个节点作为开始节点,并初始化最小查询生成树MQST的节点集合V’和边集合E’;
步骤2-2、对Q中的每一对概念(u,v),判断其是否路径可达,若可达,则在邻接表adj中保存可达节点,并使用矩阵M的M[u,v].sp和M[u,v].w分别保存RG中u、v之间的最短路径和其关联值;否则则分别设置为空和无穷大;
步骤2-3、初始化权重数组weight和小顶堆Heap;
步骤2-4、开始迭代计算,弹出堆Heap中weight最小的节点u,更新Q中u的每个路径可达节点v的weigh,保证其是v到MQST的最小关联值;
步骤2-5、调整堆并将该路径中的节点和边添加至集合V’和E’中,直至Heap为空,即Q中的节点全部添加至MQST中,迭代结束。
3.如权利要求2所述的基于语义关联网络的启发式查询扩展方法,其特征在于,步骤2-1所述关联图RG在查询Q下的查询生成树T满足:(1)T包含Q中的每一个节点;(2)T不包含环;(3)T是RG的一个连通子图;最小查询生成树MQST满足:W(MQST)=min{W(T)|T∈TS},其中TS={T1,T2,…,Tn}是满足RG和Q的所有查询生成树的集合。
4.如权利要求2所述的基于语义关联网络的启发式查询扩展方法,其特征在于,步骤2-2所述判断路径是否可达的方法是采用Dijkstra算法预先计算RG中所有节点对之间的最短路径,并保存起来,执行步骤2-2时可直接查看是否可达。
5.如权利要求2所述的基于语义关联网络的启发式查询扩展方法,其特征在于,步骤2-3所述权重weight[v]表示v到MQST的所有路径中的最小关联值;小顶堆Heap依据weight值构建并调整堆。
6.如权利要求2所述的基于语义关联网络的启发式查询扩展方法,其特征在于,步骤2-4所述路径P的关联值
Figure FDA0003178990800000023
其中rw(ei)是边ei的关联权重。
7.如权利要求2所述的基于语义关联网络的启发式查询扩展方法,其特征在于,步骤2中有效路径扩展方法包括如下:
步骤2-2-1、对查询Q=(v1,v2,…,vm)中每个节点vi进行有效路径扩展,其中,所述节点v的有效路径VP=(v’1,v’2,…,v’k)满足:(1)v等于有效路径VP的第一个节点v’1;(2)W(VP)小于等于给定关联阈值δ;(3)有效路径VP的长度k小于等于给定关联层级阈值τ;
步骤2-2-2、合并MQST和每个vi的有效路径
Figure FDA0003178990800000031
的节点,得到查询Q的启发式关联扩展查询Q’,即
Figure FDA0003178990800000032
CN201710468786.3A 2017-06-20 2017-06-20 一种基于语义关联网络的启发式查询扩展方法 Active CN107832319B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710468786.3A CN107832319B (zh) 2017-06-20 2017-06-20 一种基于语义关联网络的启发式查询扩展方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710468786.3A CN107832319B (zh) 2017-06-20 2017-06-20 一种基于语义关联网络的启发式查询扩展方法

Publications (2)

Publication Number Publication Date
CN107832319A CN107832319A (zh) 2018-03-23
CN107832319B true CN107832319B (zh) 2021-09-17

Family

ID=61643131

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710468786.3A Active CN107832319B (zh) 2017-06-20 2017-06-20 一种基于语义关联网络的启发式查询扩展方法

Country Status (1)

Country Link
CN (1) CN107832319B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10678822B2 (en) * 2018-06-29 2020-06-09 International Business Machines Corporation Query expansion using a graph of question and answer vocabulary
CN111815448B (zh) * 2020-07-09 2021-05-04 睿智合创(北京)科技有限公司 基于关联网络的申请单确定方法
CN113239815B (zh) * 2021-05-17 2022-09-06 广东工业大学 一种基于真实语义全网络学习的遥感影像分类方法、装置及设备
CN116501841B (zh) * 2023-06-26 2023-09-08 深圳市唯特视科技有限公司 数据模型模糊查询方法、系统及存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN102708104A (zh) * 2011-03-28 2012-10-03 日电(中国)有限公司 对文档排序的方法和设备
CN102999625A (zh) * 2012-12-05 2013-03-27 北京海量融通软件技术有限公司 一种检索请求语义扩展方法
CN106649266A (zh) * 2016-11-29 2017-05-10 北京科技大学 一种本体知识的逻辑推理方法

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US9158838B2 (en) * 2008-12-15 2015-10-13 Raytheon Company Determining query return referents for concept types in conceptual graphs
US8341095B2 (en) * 2009-01-12 2012-12-25 Nec Laboratories America, Inc. Supervised semantic indexing and its extensions

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101630314A (zh) * 2008-07-16 2010-01-20 中国科学院自动化研究所 一种基于领域知识的语义查询扩展方法
CN102708104A (zh) * 2011-03-28 2012-10-03 日电(中国)有限公司 对文档排序的方法和设备
CN102999625A (zh) * 2012-12-05 2013-03-27 北京海量融通软件技术有限公司 一种检索请求语义扩展方法
CN106649266A (zh) * 2016-11-29 2017-05-10 北京科技大学 一种本体知识的逻辑推理方法

Non-Patent Citations (5)

* Cited by examiner, † Cited by third party
Title
A Relation-Based Page Rank Algorithm for Semantic Web Search Engines;Fabrizio Lamberti .etc,;《IEEE TRANSACTIONS ON KNOWLEDGE AND DATA ENGINEERING>;20080606;第21卷(第1期);123-136 *
一种基于语义关联度计算的查询扩展方法;贺海宏 等;《石家庄铁路职业技术学院学报》;20140915;第13卷(第3期);72-76 *
基于Kruskal算法的最小生成树的构建;黄坤;《电脑知识与技术》;20100815;第6卷(第23期);6478-6481 *
基于语义计算的查询扩展优化研究;桑艳艳 等;《情报学报》;20071031;第26卷(第5期);704-710 *
结合概念语义空间的语义扩展技术研究;王磊 等;《计算机工程与应用》;20111013;第48卷(第35期);106-109、193 *

Also Published As

Publication number Publication date
CN107832319A (zh) 2018-03-23

Similar Documents

Publication Publication Date Title
CN109190117B (zh) 一种基于词向量的短文本语义相似度计算方法
CN103631929B (zh) 一种用于搜索的智能提示的方法、模块和系统
CN101420313B (zh) 一种针对客户端用户群进行聚类的方法和系统
CN110909164A (zh) 一种基于卷积神经网络的文本增强语义分类方法及系统
CN105045875B (zh) 个性化信息检索方法及装置
US10289717B2 (en) Semantic search apparatus and method using mobile terminal
CN110825877A (zh) 一种基于文本聚类的语义相似度分析方法
CN107832319B (zh) 一种基于语义关联网络的启发式查询扩展方法
CN106055675B (zh) 一种基于卷积神经网络和距离监督的关系抽取方法
CN106815252A (zh) 一种搜索方法和设备
US8923655B1 (en) Using senses of a query to rank images associated with the query
CN103679462A (zh) 一种评论数据处理方法和装置、一种搜索方法和系统
CN113962293B (zh) 一种基于LightGBM分类与表示学习的姓名消歧方法和系统
CN112115716A (zh) 一种基于多维词向量下文本匹配的服务发现方法、系统及设备
Lan Research on Text Similarity Measurement Hybrid Algorithm with Term Semantic Information and TF‐IDF Method
Suh et al. L-ensnmf: Boosted local topic discovery via ensemble of nonnegative matrix factorization
CN115688024A (zh) 基于用户内容特征和行为特征的网络异常用户预测方法
Li et al. A novel locality-sensitive hashing relational graph matching network for semantic textual similarity measurement
Sulthana et al. Context based classification of Reviews using association rule mining, fuzzy logics and ontology
CN112131453A (zh) 一种基于bert的网络不良短文本检测方法、装置及存储介质
CN112489689B (zh) 基于多尺度差异对抗的跨数据库语音情感识别方法及装置
CN113139558A (zh) 确定物品的多级分类标签的方法和装置
Sun et al. Entity disambiguation with decomposable neural networks
Yang et al. A hot topic detection approach on Chinese microblogging
CN113127650A (zh) 一种基于图数据库的技术图谱构建方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant