CN102663122A - 基于突发事件本体的语义查询扩展算法 - Google Patents

基于突发事件本体的语义查询扩展算法 Download PDF

Info

Publication number
CN102663122A
CN102663122A CN2012101182559A CN201210118255A CN102663122A CN 102663122 A CN102663122 A CN 102663122A CN 2012101182559 A CN2012101182559 A CN 2012101182559A CN 201210118255 A CN201210118255 A CN 201210118255A CN 102663122 A CN102663122 A CN 102663122A
Authority
CN
China
Prior art keywords
accident
similarity
concept
relation
notion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN2012101182559A
Other languages
English (en)
Inventor
杜军平
杨月华
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing University of Posts and Telecommunications
Original Assignee
Beijing University of Posts and Telecommunications
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing University of Posts and Telecommunications filed Critical Beijing University of Posts and Telecommunications
Priority to CN2012101182559A priority Critical patent/CN102663122A/zh
Publication of CN102663122A publication Critical patent/CN102663122A/zh
Pending legal-status Critical Current

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明提出了一种基于突发事件本体的语义查询扩展算法。首先从本体论的角度出发,设计了一个多层的突发事件本体模型,定义了突发事件领域概念间存在的语义关系,从而能够扩展出语义相关的概念。然后通过对影响概念相似度大小的因素进行分析,建立了一种综合考虑概念之间的语义距离、层次因素、上位概念重合度的概念相似度计算模型,更加全面地量化了本体网络中概念节点之间的相似度,能够根据相似度大小设置扩展哪些概念,避免了扩展结果同质化,并且能够使最后的查询结果按相似度有序排列。为了保证对突发事件领域词汇的分词准确性,本发明还基于突发事件领域本体对所使用的分词词库进行了扩展。

Description

基于突发事件本体的语义查询扩展算法
技术领域
本发明属于查询扩展算法,具体为基于突发事件本体的语义查询扩展算法法。该方法对已有的方法进行了改进,不仅能扩展出和查询词有上下位关系、同义关系等语义关系的词语,还能扩展出和查询词有突发事件领域特定语义关系的词语,能够根据概念相似度大小设置扩展哪些概念,避免了扩展结果发生同质化,并且能够使最后的查询结果按相似度有序排列。
背景技术
在信息检索领域中,用户输入的查询往往与文档中的目标词不相匹配,导致信息检索系统无法返回符合用户查询请求的结果集。如何对用户查询词进行处理以提高信息检索的准确率,是一个开放的问题。查询扩展是其中一种可行的解决方法,其基本思想是在原始查询词的基础上加入与用户查询词相关联的词,以组成新的更长、更准确的查询词,可以在一定程度上弥补用户查询信息不足的缺陷。
基于本体进行查询扩展的思想最早是由Voorhees在1994年提出的,主要是借助本体中明确形式化的概念定义,利用本体中的同义词和特定的子类关系来进行查询扩展。在此之后,基于本体进行查询扩展的研究不断深入,近年来已成为一个研究热点。本体因其可以明确地、形式化地表达概念的含义以及概念之间的语义关系,成为提供语义信息的“语义词典”。目前,语义查询扩展的研究方法主要是把原始查询映射到概念,根据本体中概念间的各种关系,利用一定的技术,提取出查询语义及其语义关联词,从而得到比原查询更长的新查询词。
许多方法是将查询映射到本体中的概念,或者说,它们所使用的本体(例如HowNet、WordNet)更像是简单树形结构的词表,并没有属性和实例概念,能表达的也主要是上下位关系、同义关系,因而这样的本体并不能扩展出很多语义关联词。大部分的算法找出了查询扩展词,并添加进查询词中,组成比原查询更长的查询,也就是默认查询扩展词与原查询词的权重相同,有可能导致“主题偏移”。因此查询词与查询扩展词的权重不应该相同,否则会影响最后的查询结果。为了解决这些问题,本发明提出了一种基于突发事件本体和概念相似度计算模型的语义查询扩展算法。
发明内容
本发明的目的在于提供一种基于突发事件本体和概念相似度计算模型的语义查询扩展算法,以扩展出更多有效的查询词,进而提高信息检索的查准率与查全率。首先建立了突发事件领域本体模型,然后建立概念相似度计算模型,最后给出了算法的实现步骤。
1.突发事件领域本体模型
建立的突发事件领域本体模型包括事件层、过程层、行动层和决策层。在图中,描述性的知识定义在事件层,指定突发事件的类别及其相互之间的关系;过程性知识主要定义在过程层,描述了突发事件涉及到的一系列状态,前态经过一系列过程转入终态;行动层主要定义处置突发事件所采取的行动知识,并引入角色和行动条件的概念;决策层主要定义突发事件问题、应急预案等知识。突发事件领域本体包括类、属性、关系和实例4个元素。
2.概念相似度计算模型
综合考虑概念之间的语义距离、层次因素、上位概念重合度的概念相似度计算模型如下:
Figure BSA00000705239000021
3.语义查询扩展算法
输入:用户查询内容,概念相似度阈值σ
输出:查询扩展词集合
过程:
(1)对用户查询内容基于扩展的分词词库进行分词,得到查询词集合Q,取查询词集合Q中的关键词qi
(2)将qi与本体中的类概念与实例进行匹配,若qi是本体中的类概念,则扩展与类概念具有突发事件本体中定义的语义关系的概念
(3)若qi不是本体中的类概念,则在同义词典中查找qi的同义词qi’,若找到并且qi’是本体中的类概念,则扩展与类概念具有突发事件本体中定义的语义关系的概念,否则放弃扩展
(4)应用公式(1)计算类概念与扩展概念之间的相似度,若相似度>σ,则扩展,否则放弃扩展的概念
(5)若qi是本体中的实例,则获取qi的属性和属性值并扩展其所属的类概念和属性概念,否则结束
(6)应用公式(2)计算其与其他实例之间的相似度,若大于0.6,则扩展,否则放弃
sim ins ( I m , I n ) = f ( I m ∩ I n ) = | I m ∩ I n | | I m ∪ I n | - | I m ∩ I n | - - - ( 2 )
附图说明
图1为突发事件领域本体模型图;
图2为突发事件的概念模式图;
图3为a的变化对概念相似度的影响图;
图4为概念相似度随概念所在层次的变化图;
图5为查询关键词与本体类概念的匹配过程图;
图6为查询词与实例的匹配过程图;
图7为基于突发事件本体的语义查询扩展流程图。
具体实施方式
为使本发明的目的、算法及优点更加清楚明白,以下参照附图对本发明做进一步的详细说明。
1.突发事件本体模型的建立
本发明基于突发事件知识的特征将突发事件本体模型分成了4层:事件层、过程层、行动层和决策层,如图1所示。其中,描述性的知识定义在事件层,指定突发事件的类别及其相互之间的关系;过程性知识主要定义在过程层,描述了突发事件涉及到的一系列状态,前态经过一系列过程转入终态;行动层主要定义处置突发事件所采取的行动知识,并引入角色和行动条件的概念;决策层主要定义突发事件问题、应急预案等知识。详细的模型描述如下。
(1)事件层
突发事件的发生是很复杂的,往往几种突发事件类型会同时存在。原生事件产生后,通常还会伴随着次生事件和衍生事件的发生。次生事件是指由原生事件引发的突发事件,例如地震事件会引发火灾、瘟疫流行等。衍生事件是指由原生事件派生出来的、第三次生成的、因繁衍变化而发生的一系列事件。例如由于公众对原生事件缺乏了解,或者受某些社会因素和心理影响,进行盲目避灾等导致的突发事件。在突发事件的潜伏期,可以通过外界一些实体的异常变化预测到原生事件即将发生并进行预警和采取行动进行抑制,在突发事件的潜伏期采取行动抑制事件发生能够将损失降低到最小。在某些情况下,由于两个或两个以上因素共同作用会导致突发事件进一步加剧,称之为突发事件间的耦合。一般地,突发事件间的耦合会产生1+1>2的破坏效果,所以掌握其耦合的特性对应对突发事件至关重要。由以上分析可以得出突发事件之间存在的关系包括分类关系(is_a)、时间关系(is_before)、因果关系(cause)和耦合关系(coupling)。
(2)过程层
突发事件的变化呈现一定的周期性。无沦是哪种类型的突发事件,从发展过程来看通常都经历潜伏期、爆发期、恢复期和消失儿个阶段。在潜伏期,外界环境存在着引发突发事件系统状态变化的可能性;爆发期,突发事件全面爆发,破坏性非常大;恢复期,外部环境呈现新的有序状态,突发事件处于恢复阶段,状态趋于稳定。突发事件所处的每个状态用持续时间、破坏性等属性来描述。过程层存在的主要关系是时间关系(is_before)。
(3)行动层
在可能发生或即将发生突发事件时,政府部门、遭遇突发事件的个人和社会民众会分别进行不同的行动。个人在遭遇突发事件时,要进行避灾和自救。在这个过程中,应急管理部门可根据突发事件所处的状态来形成相关的措施进行减灾、防灾和灾后恢复。首先进行预测预警,主要是进行信息收集、分析和评估及发布;突发事件爆发后,进行应急响应,一般会分级响应和启动应急预案,当所发生的突发事件没有对应的应急预案时,根据突发事件的特征采取应对措施;突发事件结束后,相关领导部门要做好善后处理,进行恢复和重建工作。此外,行动的执行是基于一定的条件的,如突发事件的状态指标、级别等。采取行动时还需要一定的应急资源,如人力资源(医生、消防人员等),物力资源(医疗设施、交通设施、通信设施等)。由以上分析可以得出行动层存在的关系主要包括顺序关系(precede、follow、synchronize)、条件关系(context_of)、执行关系(take)和需求关系(need)。
(4)决策层
决策层是基于本体的突发事件领域知识模型的核心,建立该模型的目的就在于通过描述突发事件来辅助决策。决策层主要定义应急问题、应急预案、突发事件案例以及实施方案的知识。应急预案和实施方案都是针对应急问题的,案例和应急问题类似,决策时也可以参考。根据决策目标,整体评价、已有资源和措施的可行性来选择相应的方案。另外当没有相应的应急预案、方案或可参考的案例时,可以根据事件间的关系及突发事件的状态属性来具体化问题,提出预案、方案,并根据反馈不断进行修正,以达到决策令人满意。由以上分析可以得出决策层存在的关系主要包括针对关系(aimed_at)和类似关系(refe_for)。
对于所设计的基于本体的突发事件概念模型中的突发事件知识,我们采取面向对象的方法设计了突发事件的概念模式,如图2所示。此概念模式用于构建突发事件本体。该概念模式包含4个元素:类、属性、关系和实例,说明如下。
类:指构成突发事件类别的名称。
属性:突发事件的属性包括“定义”、“时间”、“地点”、“级别”等,决策和行动的属性有“主体”、“受体”、“时间”、“地点”、“应急资源”、“条件”等,每个过程包含过程的“破坏性”、“持续时间”属性等。
关系:突发事件知识之间的关系包括is_a、cause、precede、follow、is_before、synchronize、take、context_of、coupling、need、refe_for、aimed_at。
实例:指实际发生的突发事件,继承突发事件类的属性和关系。
2.概念相似度计算模型的建立
当两个概念元素具有某些共同的语义特征时,则定义它们是相似的,用sim(A,B)表示概念A和B之间的相似度。形式上,相似度计算满足:
(1)相似度的值为[0,1]区间中的一个实数,即sim(A,B)∈[0,1]。
(2)如果两个概念是完全相似的,则相似度为1,即sim(A,B)=1当且仅当A=B。
(3)如果两个概念没有任何共同的特征,那么相似度为0,即sim(A,B)=0。
(4)相似关系是对称的,sim(A,B)=sim(B,A)。
任何一个计算本体概念相似度的算法都不可能解决所有问题,对于不同的应用,概念之间的相似度也不同,因此应根据具体领域设计相关算法和确定相关参数。根据领域本体概念之间相似的情况可以归纳出影响本体概念相似度大小的因素有以下儿个。
(1)概念之间的语义距离
两个概念之间的语义距离,是指在本体图中连接这两个节点的通路中的最短路径包含的边数。本文中用dist(A,B)来表示概念A与B之间的距离。语义距离是决定相似度的一个重要因素。一般来讲,概念之间的距离是一个[0,∞]之间的实数,且一个概念与其本身的距离为0。例如,dist(决策部门应急,配合调查)=3,dist(生产经营单位应急,配合调查)=2。两个概念的语义距离越大,其相似度越低;反之,两个概念之间的语义距离越小,其相似度越大,当dist(A,B)=0时,sim(A,B)=1;当dist(A,B)=∞时,sim(A,B)=0。我们选择使用y=e-ax函数。需要确定a的取值,a的变化对概念相似度的影响如图3所示。由图3可知,当a>0.4,语义距离x=2时,语义相似度y<0.4,偏小;当a<0.4,语义距离x=4时,语义相似度y>0.3,偏大,所以选择a=0.4是最合适的,这样就得到语义距离对语义相似度的影响函数:
sim1=e-0.4x=e-0.4dist(A,B)    (3)
(2)层次因素
在本体的层次树中,概念的组织自顶向下,分类由大到小、由粗到细,处在离根较远的层次上的概念间的相似度要比离根较近的层次上的概念间的相似度要大,同时两个概念之间相差的层次越少相似度越大,反之则越小,也就是说,对于距离相同的两个概念,其相似度随着它们所处层次的总和的增加而增加,随着它们之间层次差的增加而减小,所以计算概念相似度时必须考虑概念的层次因素。层次因素对概念相似度的影响用公式(4)可以很好地反映
sim 2 = Layer ( A ) + Layer ( B ) | Layer ( A ) - Layer ( B ) | + 1 - - - ( 4 )
其中,Layer(A)和Layer(B)分别表示概念A和B所处的层次。假设Layer(A)>Layer(B),则(Layer(A)+Layer(B))-(Layer(A)-Layer(B)+1)=2Layer(B)-1,而Layer(B)≥1,所以(Layer(A)+Layer(B))-(Layer(A)-Layer(B)+1)>0,所以sim2(A,B)>1,不符合概念相似度的取值范围,需要对其进行进一步处理,这里采用将sim2(A,B)>1除以其最大值与1的和的方法使层次因素对概念相似度的影响保持在[0,1]的范围内,但是sim2(A,B)>1的最大值与层次有关,本体的概念层次这里取4层,那么sim2(A,B)>1的最大值就为16,这样就确定了层次因素对概念相似度影响的公式:
sim 2 , ( A , B ) = Layer ( A ) + Layer ( B ) 9 ( | Layer ( A ) - Layer ( B ) | + 1 ) - - - ( 5 )
概念相似度随概念所在层次的变化如图5所示,从图中可以看出,随着两个概念层次和的增加,其相似度也在变大,同时,随着两个概念所在层次差的增大,其相似度逐渐减小。
(3)上位概念重合度
上位概念重合度是指本体中两个概念包含的相同的上位概念占概念总数的比例。上位概念重合度表明在其祖先节点(上位节点)上的相似程度。两个概念所包含的相同上位概念越多,那么它们之间的重合度越大,相似度也就越大;反之亦然。
上位概念重合度对概念相似度的影响在计算时可以转化为用相同的祖先概念的个数除以两个概念总的祖先概念数。对于任意的两个概念A和B,设anc(A)表示A的祖先概念集合,anc(B)表示B的祖先概念集合,则anc(A)∩anc(B)表示A和B相同的祖先概念集合,anc(A)∪anc(B)表示A和B的所有祖先概念集合,从而可以用式(5-4)表示概念A和B之间的上位概念重合度,此式的取值在[0,1]的范围内,所以可以直接应用到概念相似度计算模型中。
sim 3 ( A , B ) = | anc ( A ) ∩ anc ( B ) | | anc ( A ) ∪ anc ( B ) | - - - ( 6 )
综上,根据影响概念相似度的因素可以建立如式(1)所示的计算模型,由于三个主要因素对概念相似度的贡献度具体为多大还要根据具体应用确定,所以添加α、β、γ三个系数用于进行调节,α+β+γ=1。
3.基于本体的用户查询分析
通过对用户查询模式进行分析可以发现,用户主要采用单关键词、多关键词、自然语言3种查询模式,下面对这3种查询模式进行分析并给出相应的处理方法。
(1)单关键词查询模式
用户输入单个关键词作为查询条件,针对这种形式的查询,可以直接与突发事件领域本体中的概念、属性以及实例等进行匹配,然后对匹配结果进行查询扩展,在本体中扩展出原查询词的相关词用于检索。
(2)多关键词组合查询模式
对于多关键词的组合查询模式,可以通过本体中所定义的概念结构、关系和实例3部分实现查询扩展。若关键词中包含某一实例,可以直接定位到该实例对应的概念结构,并通过在突发事件本体中定义的语义关系得出用户的查询意图。这里提到的多关键词组合查询模式主要是指领域本体库中已定义的概念信息查询,其组合形式包括两种情况,第一种情况是查询过程中出现了本体已定义的信息和没有直接定义的概念,但这些无法直接处理的概念恰好与其属性取值相关。例如“汶川地震是2008年发生在中国四川省的自然灾害”,其中“汶川地震”和“自然灾害”为本体库中的实例和概念,而“2008年”和“中国四川省”分别为汶川地震突发事件的“年份”属性取值和“地点”属性取值。第二种情况为形如“汶川地震应急预案的制定”的组合查询,在本体库中存在“汶川地震”和“应急预案”的定义,并没有“制定”的信息,但这并不会影响存在于本体库中的语义载体对检索的作用,在检索时突发事件“汶川地震”的“应急预案”对象的相关信息会被检索出来,“制定”则采用关键词进行匹配,最终得到相应的信息反馈给用户。
(3)自然语言查询模式
使用关键词表达查询需求是大部分用户的查询习惯,还有很多用户希望能够以自然语言的模式来表达查询需求,例如“汶川地震的等级为多大”等,因为这样的提问方式更符合用户日常的说话习惯,更容易被用户所采用。对于这种形式的查询,首先需要对用户查询内容进行中文分词处理,生成相应的词组,通过这种方式就将基于自然语言的查询模式转化为上面提到的单关键词查询模式和多关键词组合查询模式,从而可以采用前两种查询模式的处理方法实现查询扩展。
4.用户查询词的向量表示和本体匹配
无论是单关键词模式、多关键词组合模式,还是比较复杂的自然语言查询模式,其最终都可以转换为基于关键词的查询模式。用户查询词的向量表示形式为:关键词集合表示为Q={q1,q2,...,qn},本体中的类表示为C={c1,c2,...,cn},实例表示为I={i1,i2,...,in},属性P={p1,p2,...,pn},实例的属性结构与类的属性结构是相同的。
将关键词集合Q中的每个关键词分别与领域本体中的类、实例进行匹配,匹配的情况有两种,第一种是关键词与类概念的匹配,第二种是关键词与实例概念的匹配。根据匹配对象的不同下面采用不同的处理方法。
(1)查询关键词与本体类概念的匹配
当查询关键词是领域本体中的类概念时,应用式(5-5)计算查询关键词与本体中和类概念有上下位关系、同义关系及特定语义关系的概念的相似度。当领域本体中未包含查询关键词对应的类概念时,则利用同义词典对这些关键词进行同义扩展,并按照此方法对扩展后的同义关键词进行本体类概念匹配,若仍没有与之匹配的,则关键词与本体概念的匹配结束。查询关键词与本体类概念的匹配过程如图5所示。
(2)查询关键词与本体实例的匹配
领域本体的类概念之间存在上下位关系,可以采用树的层次结构形式进行表示,节点表示领域概念,其上级节点为其父类,表示该领域概念的抽象,叶子节点为其实例。领域本体中某一类概念可以有不同的实例,其结构相同,即属性相同,但属性值不同。对于两个实例而言,它们拥有的相同属性和属性值数目越多,则这两个实例的相似性越大,因而可以通过相同属性和属性值的数目来判断关键词和实例的相似性。若关键词与领域概念匹配完成后仍没有匹配结果,则说明该关键词不属于领域概念,这时认为用户输入的关键词为类概念或实例的属性。
因此,需要统计查询关键词与领域概念实例的相同属性和相同属性值数目。若关键词与某个实例属于同一类,则定义其相似度为1;若属于不同的类,则依据属性的相似度计算公式对关键词与实例进行匹配计算,计算公式如式(2)所示,查询词与实例的匹配过程如图6所示。
5.基于本体的语义查询扩展算法
基于突发事件本体和概念相似度计算模型的语义查询扩展算法的流程如图7所示。若用户输入采用的是自然语言模式,首先需要进行分词处理,提取出关键词,然后进行本体匹配。若与本体中的类概念匹配成功,则扩展该类概念的同义词、上下位概念、实例概念以及有cause、is before、need等特定语义关系的词语,并应用公式(1)计算出扩展的概念与类概念之间的相似度;若与本体中的实例概念匹配成功,则扩展该实例概念的属性概念、所属类概念等,然后应用公式(2)计算扩展的实例与实例之间的相似度。最后将与输入关键词的相似度达到给定阈值的概念一同作为新的查询关键词进行查询。为了保证分词准确,我们对分词词库进行了扩展,将本体库中存储的概念都添加到了分词词库中,这样当用户输入句子时,能够提取出更准确的关键词。例如,当用户输入“三鹿牛奶中添加了三聚氰胺”时,进行分词处理时这个语句中的“三聚氰胺”会被分成“三”、“聚”、“氰胺”,那么查询时就得不到三聚氰胺的相关信息,但是基于突发事件本体扩展分词词库后,就会将这个词识别为一个词语。

Claims (5)

1.基于突发事件本体的语义查询扩展算法,其特征在于,首先从本体论的角度出发,设计了一个基于本体的多层突发事件领域知识模型,定义了突发事件领域概念间存在的语义关系。然后通过对影响概念相似度大小的因素进行分析,建立了一种综合考虑概念之间的语义距离、层次因素、上位概念重合度的概念相似度计算模型。为了保证对突发事件领域词汇的分词准确性,本发明还基于突发事件领域本体对所使用的分词词库进行了扩展。最后设计了基于突发事件本体和概念相似度模型实现语义查询扩展的流程。
2.根据权利要求1所述的方法,其特征在于,设计了一个基于本体的多层突发事件领域知识模型,定义了突发事件领域概念间存在的语义关系,突发事件本体模型分为4层:事件层、过程层、行动层和决策层。描述性的知识定义在事件层,指定突发事件的类别及其相互之间的关系;过程性知识主要定义在过程层,描述了突发事件涉及到的一系列状态,前态经过一系列过程转入终态;行动层主要定义处置突发事件所采取的行动知识,并引入角色和行动条件的概念;决策层主要定义突发事件问题、应急预案等知识。突发事件领域本体包括类、属性、关系和实例4个元素。突发事件领域概念之间存在的语义关系包括分类关系(is_a)、时间关系(is_before)、并发关系(synchronize)、因果关系(cause)、耦合关系(coupling)、需求关系(need)、条件关系(context_of)、顺序关系(precede、follow)、依据关系(basedon)、参考关系(refe_for)、针对关系(aimed_at)。
3.根据权利要求1所述的方法,其特征在于,建立了一种综合考虑概念之间的语义距离、层次因素、上位概念重合度的概念相似度计算模型:
Figure FSA00000705238900011
其中,sim(A,B)表示概念A和B的相似度;dist(A,B)表示概念A和B的语义距离;Layer(A)和Layer(B)分别表示概念A和B在本体中所处的层次;anc(A)和anc(B)分别表示A和B的祖先概念集合。
4.根据权利要求1所述的方法,其特征在于,基于突发事件领域本体对所使用的分词词库进行了扩展,将本体库中存储的概念都添加到了分词词库中,这样当用户输入句子时,能够提取出更准确的关键词。
5.根据权利要求1所述的方法,其特征在于,设计了基于突发事件本体和概念相似度模型实现语义查询扩展的流程:若用户输入采用的是自然语言模式,首先需要进行分词处理,提取出关键词,然后进行本体匹配。若与本体中的类概念匹配成功,则扩展该类概念的同义词、上下位概念、实例概念以及有cause、is before、need等特定语义关系的词语,并应用概念相似度计算公式计算出扩展的概念与类概念之间的相似度;若与本体中的实例概念匹配成功,则扩展该实例概念的属性概念、所属类概念等,然后应用实例相似度计算公式计算出扩展的实例与实例之间的相似度。最后将与输入关键词的相似度达到给定阈值的概念一同作为新的查询关键词进行查询。
CN2012101182559A 2012-04-20 2012-04-20 基于突发事件本体的语义查询扩展算法 Pending CN102663122A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN2012101182559A CN102663122A (zh) 2012-04-20 2012-04-20 基于突发事件本体的语义查询扩展算法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN2012101182559A CN102663122A (zh) 2012-04-20 2012-04-20 基于突发事件本体的语义查询扩展算法

Publications (1)

Publication Number Publication Date
CN102663122A true CN102663122A (zh) 2012-09-12

Family

ID=46772613

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2012101182559A Pending CN102663122A (zh) 2012-04-20 2012-04-20 基于突发事件本体的语义查询扩展算法

Country Status (1)

Country Link
CN (1) CN102663122A (zh)

Cited By (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915381A (zh) * 2012-11-20 2013-02-06 公安部第三研究所 基于多维语义的可视化网络检索呈现系统及呈现控制方法
CN103049532A (zh) * 2012-12-21 2013-04-17 东莞中国科学院云计算产业技术创新与育成中心 基于突发事件应急管理的知识库引擎构建及其查询方法
CN103500423A (zh) * 2013-09-26 2014-01-08 国家电网公司 一种电力突发事件案例适配决策方法
CN103617157A (zh) * 2013-12-10 2014-03-05 东北师范大学 基于语义的文本相似度计算方法
CN103927358A (zh) * 2014-04-15 2014-07-16 清华大学 文本检索方法及系统
CN104008097A (zh) * 2013-02-21 2014-08-27 日电(中国)有限公司 实现查询理解的方法及装置
CN104679836A (zh) * 2015-02-06 2015-06-03 中国农业大学 一种农业本体自动扩充方法
CN105741218A (zh) * 2016-03-04 2016-07-06 公安部道路交通安全研究中心 应急预案生成服务器、方法、系统以及客户端
CN106202561A (zh) * 2016-07-29 2016-12-07 北京联创众升科技有限公司 基于文本大数据的数字化应急管理案例库构建方法及装置
CN106484797A (zh) * 2016-09-22 2017-03-08 北京工业大学 基于稀疏学习的突发事件摘要抽取方法
CN106874261A (zh) * 2017-03-17 2017-06-20 中国科学院软件研究所 一种基于语义三角的领域知识图谱及查询方法
CN108009795A (zh) * 2017-12-15 2018-05-08 安徽长泰信息安全服务有限公司 一种电子政务管理信息化平台及方法
CN108228570A (zh) * 2018-01-31 2018-06-29 延安大学 一种基于实体突发特征的文本表示方法
CN108446459A (zh) * 2018-03-01 2018-08-24 云南师范大学 基于模糊语义推理的炼焦过程耗热量影响因素优化方法
CN108491374A (zh) * 2018-02-12 2018-09-04 郑长敬 基于房地产行业的词库构建方法及系统
CN108984527A (zh) * 2018-07-10 2018-12-11 广州极天信息技术股份有限公司 一种基于概念的语义识别方法及装置
CN111460822A (zh) * 2020-03-27 2020-07-28 北京百度网讯科技有限公司 主题扩展的方法、装置、设备和存储介质
CN111611410A (zh) * 2020-06-23 2020-09-01 中国人民解放军国防科技大学 基于多层网络空间知识表示的知识处理方法和装置
CN111737487A (zh) * 2020-06-10 2020-10-02 深圳数联天下智能科技有限公司 一种辅助本体构建的方法、电子设备及存储介质
CN113836289A (zh) * 2021-08-16 2021-12-24 北京邮电大学 一种实体演进规律推荐方法及装置
CN113901179A (zh) * 2021-12-10 2022-01-07 中国测绘科学研究院 一种基于自然语言的人员流动应急管理信息结构化方法

Cited By (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102915381A (zh) * 2012-11-20 2013-02-06 公安部第三研究所 基于多维语义的可视化网络检索呈现系统及呈现控制方法
CN103049532A (zh) * 2012-12-21 2013-04-17 东莞中国科学院云计算产业技术创新与育成中心 基于突发事件应急管理的知识库引擎构建及其查询方法
CN104008097A (zh) * 2013-02-21 2014-08-27 日电(中国)有限公司 实现查询理解的方法及装置
CN103500423A (zh) * 2013-09-26 2014-01-08 国家电网公司 一种电力突发事件案例适配决策方法
CN103617157B (zh) * 2013-12-10 2016-08-17 东北师范大学 基于语义的文本相似度计算方法
CN103617157A (zh) * 2013-12-10 2014-03-05 东北师范大学 基于语义的文本相似度计算方法
CN103927358A (zh) * 2014-04-15 2014-07-16 清华大学 文本检索方法及系统
CN103927358B (zh) * 2014-04-15 2017-02-15 清华大学 文本检索方法及系统
CN104679836A (zh) * 2015-02-06 2015-06-03 中国农业大学 一种农业本体自动扩充方法
CN104679836B (zh) * 2015-02-06 2018-11-20 中国农业大学 一种农业本体自动扩充方法
CN105741218A (zh) * 2016-03-04 2016-07-06 公安部道路交通安全研究中心 应急预案生成服务器、方法、系统以及客户端
CN106202561A (zh) * 2016-07-29 2016-12-07 北京联创众升科技有限公司 基于文本大数据的数字化应急管理案例库构建方法及装置
CN106202561B (zh) * 2016-07-29 2019-10-01 北京联创众升科技有限公司 基于文本大数据的数字化应急管理案例库构建方法及装置
CN106484797A (zh) * 2016-09-22 2017-03-08 北京工业大学 基于稀疏学习的突发事件摘要抽取方法
CN106484797B (zh) * 2016-09-22 2020-01-10 北京工业大学 基于稀疏学习的突发事件摘要抽取方法
CN106874261A (zh) * 2017-03-17 2017-06-20 中国科学院软件研究所 一种基于语义三角的领域知识图谱及查询方法
CN108009795A (zh) * 2017-12-15 2018-05-08 安徽长泰信息安全服务有限公司 一种电子政务管理信息化平台及方法
CN108228570A (zh) * 2018-01-31 2018-06-29 延安大学 一种基于实体突发特征的文本表示方法
CN108491374A (zh) * 2018-02-12 2018-09-04 郑长敬 基于房地产行业的词库构建方法及系统
CN108491374B (zh) * 2018-02-12 2022-05-27 郑长敬 基于房地产行业的词库构建方法及系统
CN108446459A (zh) * 2018-03-01 2018-08-24 云南师范大学 基于模糊语义推理的炼焦过程耗热量影响因素优化方法
CN108446459B (zh) * 2018-03-01 2022-03-22 云南师范大学 基于模糊语义推理的炼焦过程耗热量影响因素优化方法
CN108984527A (zh) * 2018-07-10 2018-12-11 广州极天信息技术股份有限公司 一种基于概念的语义识别方法及装置
CN111460822A (zh) * 2020-03-27 2020-07-28 北京百度网讯科技有限公司 主题扩展的方法、装置、设备和存储介质
CN111460822B (zh) * 2020-03-27 2024-02-27 北京百度网讯科技有限公司 主题扩展的方法、装置、设备和存储介质
CN111737487A (zh) * 2020-06-10 2020-10-02 深圳数联天下智能科技有限公司 一种辅助本体构建的方法、电子设备及存储介质
CN111611410A (zh) * 2020-06-23 2020-09-01 中国人民解放军国防科技大学 基于多层网络空间知识表示的知识处理方法和装置
CN111611410B (zh) * 2020-06-23 2024-01-12 中国人民解放军国防科技大学 基于多层网络空间知识表示的知识处理方法和装置
CN113836289A (zh) * 2021-08-16 2021-12-24 北京邮电大学 一种实体演进规律推荐方法及装置
CN113901179A (zh) * 2021-12-10 2022-01-07 中国测绘科学研究院 一种基于自然语言的人员流动应急管理信息结构化方法

Similar Documents

Publication Publication Date Title
CN102663122A (zh) 基于突发事件本体的语义查询扩展算法
Li et al. Comparison of word embeddings and sentence encodings as generalized representations for crisis tweet classification tasks
CN101655857A (zh) 基于关联规则挖掘技术挖掘建设法规领域数据的方法
Gusev et al. Using query patterns to learn the duration of events
CN102298642A (zh) 文本信息抽取方法和系统
Saraf et al. EMBERS autogsr: Automated coding of civil unrest events
CN112328794B (zh) 台风事件信息聚合方法
CN103886099A (zh) 一种模糊概念的语义检索系统及方法
JP5504097B2 (ja) 意味的に類似している語対を二項関係に分類する二項関係分類プログラム、方法及び装置
Segev Context ontology for humanitarian assistance in crisis response
CN101770473A (zh) 层次化语义脉络文档查询方法
Zavarella et al. An Ontology-Based Approach to Social Media Mining for Crisis Management.
Tovar et al. Identification of Ontological Relations in Domain Corpus Using Formal Concept Analysis.
CN115689224A (zh) 基于轨迹语义化和图卷积网络的出租车需求预测方法
Khiroun et al. A possibilistic approach for automatic word sense disambiguation
Huang PhraseCTM: Correlated topic modeling on phrases within Markov random fields
Wang et al. An ontology automation construction scheme for Chinese e‐government thesaurus optimizing
Pshenichny et al. Representation of the event bush approach in terms of directed hypergraphs
Zhang FuzWare: A fuzzy-based middleware for context-aware service
Kazi et al. A deep learning approach to building a framework for Urdu POS and NER
Syliongka et al. Combining automatic and manual approaches: Towards a framework for discovering themes in disaster-related Tweets
Gupta et al. Forecasting civil strife: An emerging methodology
Kalaiselvi Hot News Detection System Using Rule-Based Technique
Lili et al. Semantic ontology method of learning resource based on the approximate subgraph isomorphism
Liang et al. MGP: Extracting multi-granular phases for evolutional events on social network platforms

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Application publication date: 20120912