CN103020283A - 一种基于背景知识的动态重构的语义检索方法 - Google Patents

一种基于背景知识的动态重构的语义检索方法 Download PDF

Info

Publication number
CN103020283A
CN103020283A CN201210580666XA CN201210580666A CN103020283A CN 103020283 A CN103020283 A CN 103020283A CN 201210580666X A CN201210580666X A CN 201210580666XA CN 201210580666 A CN201210580666 A CN 201210580666A CN 103020283 A CN103020283 A CN 103020283A
Authority
CN
China
Prior art keywords
attribute
alpha
formal context
property set
formal
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201210580666XA
Other languages
English (en)
Other versions
CN103020283B (zh
Inventor
马应龙
张潇澜
宋鹏
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
North China Electric Power University
Original Assignee
North China Electric Power University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by North China Electric Power University filed Critical North China Electric Power University
Priority to CN201210580666.XA priority Critical patent/CN103020283B/zh
Publication of CN103020283A publication Critical patent/CN103020283A/zh
Application granted granted Critical
Publication of CN103020283B publication Critical patent/CN103020283B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了信息检索技术领域中的一种基于背景知识的动态重构的语义检索方法。包括:先采用二维表给出通用领域的背景知识,利用FCA方法将其构建为概念格模型。然后把用户输入的搜索关键词作为检索属性,分析其与原有形式背景属性集的关系;如果所有检索属性属于形式背景属性集,则直接基于概念格模型进行语义检索;否则,则对领域知识的形式背景进行动态重构;进一步通过相似度计算从属性集中找出与每一个检索属性最为相似的对应替换属性,更新检索属性集;最后,利用重构后的形式背景构建新的概念格结构,并利用此结构完成基于检索属性集的语义检索。本发明通过基于背景知识的动态重构的语义检索方法,能够确保检索结果满足用户的检索要求。

Description

一种基于背景知识的动态重构的语义检索方法
技术领域
本发明属于信息检索技术领域,尤其涉及一种基于背景知识的动态重构的语义检索方法。
背景技术
随着互联网的快速发展,网络的信息量越来越大,如何从海量数据中检索到用户真正需要的信息成为信息检索的关键任务。应用广泛的信息检索是目前信息科学的一个研究热点,各种方法技术不断涌现。信息检索的研究方法大体上可以分为基于语法的检索和基于内容的检索两个方面。目前大多数的检索方法都是基于语法的检索。通过爬虫等技术从互联网上抓取网页,然后进行信息抽取,对其进行智能化信息处理,并通过相关的索引和排序技术为用户提供信息检索服务。上述方法没有涉及到对检索内容的语义挖掘,从而在很多情况下返回给用户很多冗余的信息,如较低的查准率导致大量不相关的检索结果,导致检索任务很大程度上依赖于用户的检索技巧,从而加重了用户的检索负担。目前基于内容的检索成一个研究热点。基于内容的检索涉及到信息的语义方面挖掘和处理,能够兼顾信息的语法和语义信息,尽可能的通过信息的背景知识挖掘其更深层次的语义信息,因此,检索结果往往能够更加满足用户真正的检索需求。但是,目前如何对信息的背景知识进行描述、在信息动态演化基础上如何对背景知识进行重构以适应信息演化的需要以及如何基于背景知识进行相关的语义检索仍处于初步阶段,缺乏相关的可行研究方法。
发明内容
本发明结合上述背景技术中提到的问题以及信息检索领域的信息发展趋势和需求,提出一种基于背景知识的动态重构的语义检索方法。本方法综合了语法相似度和语义相似度两方面因素,尽可能的避免各种因素造成的检索误差,并对检索结果进行进一步精确划分,得到满足用户的更为准确的检索结果,减少用户的检索负担。
为了实现上述目的,本发明提出的技术方案是,一种基于背景知识的动态重构的语义检索方法,采用二维表表示通用领域知识的形式背景,利用FCA方法构建形式背景的概念格结构模型,得到形式背景属性集和形式背景对象集,其特征是所述方法包括:
步骤1:将用户输入的检索关键词作为检索属性集S={S1,s2,...,Sm}并令i=1;
步骤2:分析检索属性si与形式背景属性集A的关系,如果则执行步骤3;如果si∈A,执行步骤9;
步骤3:加载与检索属性si相关的具体领域知识,合并二维表,重构形式背景属性集,即令A=A∪Ai,Ai为与si相关的具体领域知识的形式背景的属性集;
步骤4:如果
Figure BDA00002667609600022
则执行步骤5;如果si∈A,执行步骤9;
步骤5:计算检索属性si与形式背景属性集A中所有属性的相似度值simj,并令Sim=max{sim1,sim2,...simn},n为形式背景属性集A中的属性数目;
步骤6:如果Sim小于设定阈值,则执行步骤7;如果Sim值大于或等于设定阈值,则执行步骤8;
步骤7:从检索属性集中删除属性si,即令S=\{Si},执行步骤9;
步骤8:在形式背景属性集A中,找出与检索属性si最为相似的属性αj,用属性αj替换检索属性si
步骤9:判断i<m是否成立,如果成立,则令i=i+1,返回步骤3;否则,执行步骤10;
步骤10:进行基于检索属性集的语义检索。
所述计算检索属性si与形式背景属性集A中属性αj的相似度值采用公式:
Sim(sij)=λ×Syn(sij)+(1-λ)×Sem(sij)
其中,Sim(sij)是检索属性si与形式背景属性集A中属性αj的相似度值,Syn(sij)是语法相似度值,Sem(sij)是语义相似度值,λ是线性叠加系数;
所述语法相似度值Syn(sij)的计算公式为:
Sym ( S i , α j ) = α ED 2 ( S i , α j ) + α ,
ED(sij)是检索属性si与形式背景属性集A中属性αj的编辑距离,a为设定参数,编辑距离是指两个字串之间,由一个字串转成另一个字串所需的最少编辑操作次数;
所述语义相似度值的计算公式为:
Sem ( s i , α j ) = D s i → · D α j → | D s i → | × | D α j → | ,
D s i → = ( D s i 1 , D s i 2 , · · · , D s i t ) , D α j → = ( D α j 1 , D α j 2 , · · · , D α j t ) , D s i k = ϖ ( η s i k ) Σ i = 1 t ϖ ( η s i i ) × ( η s i k , μ α j k ) ,
Figure BDA00002667609600036
Figure BDA00002667609600037
是检索属性si的第k个义原
Figure BDA00002667609600038
在义原结构树中对应结点的度数,
Figure BDA00002667609600041
是形式背景属性集A中属性αj的第k个义原
Figure BDA00002667609600042
在义原结构树中对应结点的度数,
Figure BDA00002667609600043
是检索属性si和形式背景属性集A中属性αj的对应第k对义原的相似度值;
所述检索属性si和形式背景属性集A中属性αj的对应第k对义原的相似度值的计算公式为:
b ( η s i k , μ α j k ) = β β + d ( η s i k , μ α j k ) ,
Figure BDA00002667609600045
是检索属性si的义原向量
Figure BDA00002667609600046
的第k个分量,是形式背景属性集A中属性αj的义原向量
Figure BDA00002667609600048
的第k个分量,t为向量的长度。
本发明能够根据用户输入的检索关键词对形式背景进行动态重构,对结果进行动态的较为精确地划分,从而满足用户的检索需求。
附图说明
图1是基于背景知识的动态重构的语义检索方法的流程图;
图2是通用领域知识的形式背景对应的二维表;
图3是加入具体领域知识后形成的新的形式背景对应的二维表;
图4是实施例中通用领域知识的形式背景所对应的概念格的哈希图;
图5是加入与检索属性相关的具体领域知识后形成的新的形式背景所对应的概念格的哈希图。
具体实施方式
下面结合附图,对优选实施例作详细说明。应该强调的是,下述说明仅仅是示例性的,而不是为了限制本发明的范围及其应用。
实施例1
本发明首先采用二维表表示通用领域知识的形式背景。然后构建层次清晰的概念格结构模型。经过一系列的分析和重构,最后通过此结构模型完成基于检索属性集的语义检索。
采用二维表表示通用领域知识的形式背景,利用FCA(Formal ConceptAnal ysis,形式化概念分析)方法构建形式背景的概念格结构模型。在表示领域知识形式背景的二维表中,行代表属性集,列代表对象集,行与列的交点代表某一个对象是否具有对应的这个属性。在实施例中,本方法用符号“×”表示对象具有此属性,空表示对象不具有此属性。根据二维表构建形式背景的概念格结构模型,并画出哈希图。哈希图中的每个结点代表一个形式概念,这个概念结点包括两部分:对象集Oc和属性集Ac
图1是基于背景知识的动态重构的语义检索方法的流程图。图1中,发明提供的基于背景知识的动态重构的语义检索方法包括:
步骤1:将用户输入的检索关键词作为检索属性集S={s12,...,sm}并令汇1。形式背景的对象集记为O={o1,o2,...,on},属性集记为:A={α12,...,αn}。
步骤2:分析检索属性si与形式背景属性集A的关系,如果则执行步骤3;如果si∈A,执行步骤9。
步骤3:加载与检索属性si相关的具体领域知识,合并二维表,重构形式背景属性集,即令A=A∪Ai,Ai为与si相关的具体领域知识的形式背景的属性集。
步骤4:如果则执行步骤5;如果si∈A,执行步骤9。
步骤5:计算检索属性si与形式背景属性集A中所有属性的相似度值simj,并令Sim=max{im1,sim2,...simn},n为形式背景属性集A中的属性数目。
计算检索属性si与形式背景属性集A中属性αj的相似度值采用公式:
Sim(sij)=λ×Syn(sij)+(1-λ)×Sem(sij)    (1)
其中,Sim(sij)是检索属性si与形式背景属性集A中属性αj的相似度值,Syn(sij)是语法相似度值,Sem(sij)是语义相似度值,λ是线性叠加系数。
语法相似度通过编辑距离ED来计算,编辑距离主要是比较字符串的相似程度。具体为两个字符串之间,由一个转成另一个所需的最少编辑操作次数。许可的编辑操作包括将一个字符替换成另一个字符,插入一个字符,删除一个字符。可知,编辑距离越大,相似度越小。Syn(sij)的计算公式为:
( s i , α j ) = α ED 2 ( s i , α j ) - - - ( 2 )
其中,Syn(sij)为语法相似度值,ED(sij)为si和αj的编辑距离,a为参数。本方法取a值为1。
Sem(sij)值利用HowNet工具来计算,计算语义相似度值主要包括以下两个子步骤:
首先,计算两个属性si和αj的对应第k对义原的相似度值
Figure BDA00002667609600062
在HowNet中,每个属性对应一组义原。义原被定义为最基本的、不易于再分割的最小意义单位。属性的相似度计算,最终归结为对应义原的相似度计算。义原之间的关系主要有8种,本方法主要借用其中的上下位关系。根据义原的上下位关系,所有的“基本义原”组成了一个树状结构的义原层次体系。计算义原相似度值采用公式:
b ( η s i k , μ α j k ) = β β + d ( η s i k , μ α j k ) - - - ( 3 )
其中,组成属性的多个义原根据HowNet提供的方法构成一个义原向量。本发明中用
Figure BDA00002667609600071
表示属性si的义原向量,用
Figure BDA00002667609600072
表示属性αj的义原向量,则有: η s i = ( η s i 1 , η s i 2 , · · · , η s i p ) , μ α j = ( μ s i 1 , μ s i 2 , · · · μ s i q ) , 其中p为向量
Figure BDA00002667609600075
的长度,q为向量
Figure BDA00002667609600076
的长度。取t=max{,q},将向量
Figure BDA00002667609600077
Figure BDA00002667609600078
分别扩展成长度为t的向量,多出来的(t-p)或(t-q)个分量均记为空。设
Figure BDA000026676096000710
分别为
Figure BDA000026676096000711
Figure BDA000026676096000712
的第k个分量,构成第k个义原对,
Figure BDA000026676096000713
记为这个义原对的相似度值。如果义原对中存在空的分量,则二者的相似度值记为0。
Figure BDA000026676096000714
记为这个义原对的语义距离,本发明利用HowNet工具提供的算法来计算这个距离值。
其次,计算检索属性si和αj的语义相似度值Sem(sij)采用公式:
Sem ( s i , α j ) = D s i → · D α j → | D s i → | × | D α j → | - - - ( 4 )
其中, D s i → = ( D s i 1 , D s i 2 , · · · D s i t ) , D α j → = ( D α j 1 , D α j 2 , · · · D α j t ) , 长度均为t;
Figure BDA000026676096000718
Figure BDA000026676096000719
义原为HowNet义原结构树中的结点。
Figure BDA000026676096000720
为属性si的第k个义原
Figure BDA000026676096000721
在义原结构树中对应结点的度数,
Figure BDA000026676096000722
为属性αj的第k个义原
Figure BDA000026676096000723
在义原结构树中对应结点的度数。本方法设定阈值为0.65。
步骤6:如果Sim小于设定阈值,则执行步骤7;如果Sim值大于或等于设定阈值,则执行步骤8。
步骤7:从检索属性集中删除属性si,即令S=\{si},执行步骤9。
步骤8:在形式背景属性集A中,找出与检索属性si最为相似的属性αj,用属性αj替换检索属性si
步骤9:判断i<m是否成立,如果成立,则令i=i+1,返回步骤3;否则,执行步骤10。
步骤10:进行基于检索属性集的语义检索。
实施例2
本方法利用形式背景的概念格结构模型进行基于检索属性集S的语义检索。具体做法是,将集合S中的元素与每个形式概念结点的属性集匹配,找出符合条件的结点,它的对象集就是检索结果。
本发明为一种基于背景知识的动态重构的语义检索方法。主要根据用户的检索属性完成形式背景和概念格的重构,从而将结果进一步划分,得到更加符合要求的检索结果。在相似度计算方面,本方法综合了语法和语义两方面的因素,既避免了输入关键词时由于误拼而产生的误差,又考虑了检索属性语义方面的深层次影响,从而更为准确的更新检索属性集,为最后的检索打下好的基础。总之,与现有技术相比,本发明能够得到符合条件的更加准确的检索信息。
以下通过一更加具体的实施例详细说明本发明的具体过程,共分为4个部分:
1.如图2所示,先给出通用领域的形式背景,其对应的概念格结构为图4。每一个结点对应一个形式概念。形式背景是一个三元组,记为CB=(,A,R)。其中O表示对象集,A表示属性集,R为O与A的关系。在本实施例中,O={o1,o2,..,o12}={杠柳,合掌消,长寿花,龙胆,白薇,桂花,徐长卿,狭叶荨麻,毒芹,黄苓,荷包牡丹,夜来香};A={α11,...,α8}={草木,灌木,藤木,叶对生,聚伞花序,圆锥花序,总状花序,伞形花序}。形式概念是一个二元组,记为Ci=(Oc,Ac),(1≤i≤10),Oc为形式概念的对象集,Ac为形式概念的属性集。本实施例的每个形式概念结点表示的含义分别为:
C1=({杠柳,合掌消,长寿花,龙胆,白薇,桂花,徐长卿,狭叶荨麻,毒芹,黄苓,荷包牡丹,夜来香},{叶对生});
C2=({合掌消,长寿花,龙胆,白薇,徐长卿,狭叶荨麻,毒芹,黄苓,荷包牡丹},{叶对生,草本})
C3=({杠柳,合掌消,长寿花,龙胆,桂花,夜来香},{叶对生,聚伞花序})
C4=({毒芹,夜来香},{叶对生,伞形花序})
C5=({徐长卿,狭叶荨麻},{叶对生,草本,圆锥花序})
C6=({合掌消,长寿花,龙胆},{叶对生,草本,聚伞花序})
C7=({黄苓,荷包牡丹},{叶对生,草本,总状花序})
C8=({毒芹},{叶对生,草本,伞形花序})
C9=({夜来香},{叶对生,聚伞花序,伞形花序})
C10=(Φ,{草木,灌木,藤木,叶对生,聚伞花序,圆锥花序,总状花序,伞形花序})
2.输入关键词为叶对生、伞形花序来搜索对象毒芹。本方法将检索关键词作为检索属性集,记为S={1,s2}={叶对生,聚伞花序}。根据以上给出的概念格,将集合S与每一个形式概念结点的属性集进行一一匹配,符合条件的结点为4,C8和C9。将这些形式概念结点对应的对象集合{毒芹,夜来香}作为查询结果,全部输出,显然不够精确。
3.添加检索属性毒性记为s3,并添加与s3相关的药用领域知识的形式背景,即添加三个属性:毒性、止咳和祛风湿,此时的检索属性集变为S={s1,s2,s3}。重新构造的形式背景为图3所示,对应的概念格结构为图5所示。新的形式背景的属性集变为A={α12,..α910,α11}={草木,灌木,藤木,叶对生,聚伞花序,圆锥花序,总状花序,伞形花序,毒性,止咳,祛风湿}。新的概念格的结点表示的含义为如下所示:
C1C23C4和C6与原有的概念结点完全一样;
C5=({合掌消,徐长卿,狭叶荨麻},{叶对生,草本,祛风湿});
C7=({徐长卿,狭叶荨麻},{叶对生,草本,祛风湿,圆锥花序});
C8和原有概念格中的C7结点完全一样;
C9=({毒芹},{叶对生,草本,伞形花序,毒性});
C10=({杠柳,桂花},{叶对生,灌木,聚伞花序});
C11和原有概念格中的C9结点完全一样;
C12=({合掌消},{叶对生,草本,祛风湿,聚伞花序});
C13和原有概念格中的C10结点完全一样;
在重构后的概念格结构中,匹配检索属性集S与每一个结点的属性集,符合条件的结点为C9,将其对象集的元素“毒芹”作为检索结果显示出来。这个结果符合用户的检索需求。这说明通过动态添加与检索属性相关的具体领域知识的形式背景后,可以得到符合用户要求的更为准确的检索结果。
4.如果出现误拼,比如输入的检索属性集为S={s1,s2,s3}={叶对生,伞形花序,毒素},通过分析S中每个元素与形式背景属性集的关系会发现,s3即不属于通用领域的形式背景属性集中,也不属于重构后的形式背景属性集中。这个时候,本方法就会进行流程中的步骤3,即进行属性相似度计算,找到检索属性毒素在形式背景属性集中的替换属性。通过观察比较毒素与形式背景属性中的属性,可知和其最相近的应该为属性α9“毒性”,所以本实施例只给出s3和α9的相似度计算,作为最终的Sim(s39)的值。本实施例记s3=毒素,α9=毒性。则二者的相似度计算如下:
4.1计算s3和α9的编辑距离可得:ED(s39)=1,所以毒性和毒素的语法相似度为: Syn ( s 3 , α 9 ) = α ED 2 ( s 3 , α 9 ) + α = 1 1 2 + 1 = 0.50 .
4.2通过HowNet工具计算s3和α9的语义相似度:
毒素s3的义原集为{物质,毒},毒性α9的义原集为{性质,毒}。通过HowNet工具可知s3和α9对应义原对的相似度值为:
Figure BDA00002667609600113
所以义原向量为
Figure BDA00002667609600114
经过向量
Figure BDA00002667609600115
调节后的各自的向量为:
Figure BDA00002667609600116
Figure BDA00002667609600117
所以 D s 3 → = ( 0.3 × 0.6,0.7 × 1 ) = ( 0.18,0.7 ) ;
Figure BDA00002667609600119
Figure BDA00002667609600121
据此, D α 9 → = ( 0.4 × 0.6,0.6 × ) ( 0.24,0.6 ) .
最后可以得出, Sem ( s 3 , α 9 ) = D s 3 → · D α 9 → | D s 3 → | × | D α 9 → | 0.9917 .
4.3计算s3和α9的属性相似度值为:
Sim(s39)=λ×Syn(s39)+(1-λ)×Sem(s39)
=0.3×0.5+(1-0.3)×0.9917=0.8442
可知Sim(s39)大于本方法设定的阈值0.65,可知毒性可作为毒素的替换属性,更新检索属性集,为S={s1,s2,s3}={叶对生,伞形花序,毒性}。可知更新后的属性集正好变为第2部分中所描述的检索属性集,对应的形式背景为第3部分描述的新的形式背景,所以由第3部分的检索过程可知,本检索结果同为“毒芹”,符合用户的检索要求。
以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应该以权利要求的保护范围为准。

Claims (2)

1.一种基于背景知识的动态重构的语义检索方法,采用二维表表示通用领域知识的形式背景,利用FCA方法构建形式背景的概念格结构模型,得到形式背景属性集和形式背景对象集,其特征是所述方法包括:
步骤1:将用户输入的检索关键词作为检索属性集S={s1,s2,…,sm}并令i=1;
步骤2:分析检索属性si与形式背景属性集A的关系,如果
Figure FDA00002667609500011
则执行步骤3;如果si∈A,执行步骤9;
步骤3:加载与检索属性si相关的具体领域知识,合并二维表,重构形式背景属性集,即令A=A∪Ai,Ai为与si相关的具体领域知识的形式背景的属性集;
步骤4:如果
Figure FDA00002667609500012
则执行步骤5;如果si∈A,执行步骤9;
步骤5:计算检索属性si与形式背景属性集A中所有属性的相似度值simj,并令Sim=max{sim1,sim2,.simn},n为形式背景属性集A中的属性数目;
步骤6:如果Sim小于设定阈值,则执行步骤7;如果Sim值大于或等于设定阈值,则执行步骤8;
步骤7:从检索属性集中删除属性si,即令S=S\{si},执行步骤9;
步骤8:在形式背景属性集A中,找出与检索属性si最为相似的属性αj,用属性αj替换检索属性si
步骤9:判断i<m是否成立,如果成立,则令i=i+1,返回步骤3;否则,执行步骤10;
步骤10:进行基于检索属性集的语义检索。
2.根据权利要求1所述的方法,其特征是所述计算检索属性si与形式背景属性集A中属性αj的相似度值采用公式:
Sim(si,αj)=λ×Syn(si,αj)+(1-λ)×Sem(si,αj)
其中,Sim(si,αj)是检索属性si与形式背景属性集A中属性αj的相似度值,Syn(si,αj)是语法相似度值,Sem(si,αj)是语义相似度值,λ是线性叠加系数;
所述语法相似度值Syn(si,αj)的计算公式为:
Syn ( s i , α j ) = α ED 2 ( s i , α j ) + α ,
ED(si,αj)是检索属性si与形式背景属性集A中属性αj的编辑距离,a为设定参数,编辑距离是指两个字串之间,由一个字串转成另一个字串所需的最少编辑操作次数;
所述语义相似度值的计算公式为:
Sem ( s i , α j ) = D s i → · D α j → | D s i → | × | D α j → | ,
D s i → = ( D s i 1 , D s i 2 , · · · D s i t ) , D α j → = ( D α j 1 , D α j 2 , · · · D α j t ) ,
Figure FDA00002667609500025
Figure FDA00002667609500026
Figure FDA00002667609500027
是检索属性si的第k个义原
Figure FDA00002667609500028
在义原结构树中对应结点的度数,
Figure FDA00002667609500029
是形式背景属性集A中属性αj的第k个义原
Figure FDA000026676095000210
在义原结构树中对应结点的度数,是检索属性si和形式背景属性集A中属性αj的对应第k对义原的相似度值;
所述检索属性si和形式背景属性集A中属性αj的对应第k对义原的相似度值的计算公式为:
b ( η s i k , μ α j k ) = β β + d ( η s i k , μ α j k ) ,
Figure FDA00002667609500032
是检索属性si的义原向量
Figure FDA00002667609500033
的第k个分量,
Figure FDA00002667609500034
是形式背景属性集A中属性αj的义原向量的第k个分量,t为向量的长度。
CN201210580666.XA 2012-12-27 2012-12-27 一种基于背景知识的动态重构的语义检索方法 Expired - Fee Related CN103020283B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201210580666.XA CN103020283B (zh) 2012-12-27 2012-12-27 一种基于背景知识的动态重构的语义检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201210580666.XA CN103020283B (zh) 2012-12-27 2012-12-27 一种基于背景知识的动态重构的语义检索方法

Publications (2)

Publication Number Publication Date
CN103020283A true CN103020283A (zh) 2013-04-03
CN103020283B CN103020283B (zh) 2015-12-09

Family

ID=47968886

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201210580666.XA Expired - Fee Related CN103020283B (zh) 2012-12-27 2012-12-27 一种基于背景知识的动态重构的语义检索方法

Country Status (1)

Country Link
CN (1) CN103020283B (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778262A (zh) * 2014-03-06 2014-05-07 北京林业大学 基于叙词表的信息检索方法及装置
CN104133812A (zh) * 2014-07-17 2014-11-05 北京信息科技大学 一种面向用户查询意图的汉语句子相似度分层计算方法及装置
CN105260488A (zh) * 2015-11-30 2016-01-20 哈尔滨工业大学 一种用于语义理解的文本序列迭代方法
CN105573971A (zh) * 2014-10-10 2016-05-11 富士通株式会社 表格重构装置和方法
CN106021251A (zh) * 2015-09-16 2016-10-12 展视网(北京)科技有限公司 一种基于背景知识的层次语义模型图像检索方法
CN106293785A (zh) * 2015-05-21 2017-01-04 富士通株式会社 对级联样式表的规则集进行优化的方法和装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208693A1 (en) * 2006-03-03 2007-09-06 Walter Chang System and method of efficiently representing and searching directed acyclic graph structures in databases
CN101169780A (zh) * 2006-10-25 2008-04-30 华为技术有限公司 一种基于语义本体的检索系统和方法
US20080109212A1 (en) * 2006-11-07 2008-05-08 Cycorp, Inc. Semantics-based method and apparatus for document analysis
CN101710318A (zh) * 2009-09-08 2010-05-19 中国农业大学 蔬菜供应链知识智能获取系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070208693A1 (en) * 2006-03-03 2007-09-06 Walter Chang System and method of efficiently representing and searching directed acyclic graph structures in databases
CN101169780A (zh) * 2006-10-25 2008-04-30 华为技术有限公司 一种基于语义本体的检索系统和方法
US20080109212A1 (en) * 2006-11-07 2008-05-08 Cycorp, Inc. Semantics-based method and apparatus for document analysis
CN101710318A (zh) * 2009-09-08 2010-05-19 中国农业大学 蔬菜供应链知识智能获取系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
徐慧等: "基于本体相似度的中文科研论文信息抽取", 《计算机技术与发展》, vol. 18, no. 12, 31 December 2008 (2008-12-31), pages 203 - 206 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103778262A (zh) * 2014-03-06 2014-05-07 北京林业大学 基于叙词表的信息检索方法及装置
CN103778262B (zh) * 2014-03-06 2017-07-21 北京林业大学 基于叙词表的信息检索方法及装置
CN104133812A (zh) * 2014-07-17 2014-11-05 北京信息科技大学 一种面向用户查询意图的汉语句子相似度分层计算方法及装置
CN104133812B (zh) * 2014-07-17 2017-03-08 北京信息科技大学 一种面向用户查询意图的汉语句子相似度分层计算方法及装置
CN105573971A (zh) * 2014-10-10 2016-05-11 富士通株式会社 表格重构装置和方法
CN105573971B (zh) * 2014-10-10 2018-09-25 富士通株式会社 表格重构装置和方法
CN106293785A (zh) * 2015-05-21 2017-01-04 富士通株式会社 对级联样式表的规则集进行优化的方法和装置
CN106021251A (zh) * 2015-09-16 2016-10-12 展视网(北京)科技有限公司 一种基于背景知识的层次语义模型图像检索方法
CN105260488A (zh) * 2015-11-30 2016-01-20 哈尔滨工业大学 一种用于语义理解的文本序列迭代方法
CN105260488B (zh) * 2015-11-30 2018-10-02 哈尔滨工业大学 一种用于语义理解的文本序列迭代方法

Also Published As

Publication number Publication date
CN103020283B (zh) 2015-12-09

Similar Documents

Publication Publication Date Title
CN101364239B (zh) 一种分类目录自动构建方法及相关系统
CN103020283B (zh) 一种基于背景知识的动态重构的语义检索方法
CN101582080B (zh) 一种基于图像和文本相关性挖掘的Web图像聚类方法
CN101630314B (zh) 一种基于领域知识的语义查询扩展方法
CN102760134B (zh) 一种同义词的挖掘方法和装置
CN101694668B (zh) 网页结构相似性确定方法及装置
CN102253930B (zh) 一种文本翻译的方法及装置
CN106649260A (zh) 基于评论文本挖掘的产品特征结构树构建方法
CN104899273A (zh) 一种基于话题和相对熵的网页个性化推荐方法
CN102402561B (zh) 一种搜索方法和装置
CN103823824A (zh) 一种借助互联网自动构建文本分类语料库的方法及系统
CN105706078A (zh) 实体集合的自动定义
CN105550189A (zh) 基于本体的信息安全事件智能检索系统
CN102708100A (zh) 挖掘相关实体词的关系关键词的方法和装置及其应用
CN102982168B (zh) 一种基于xml文档的元数据模式匹配方法
CN1996316A (zh) 基于网页相关性的搜索引擎搜索方法
CN102156728B (zh) 一种改进的基于用户兴趣模型的个性化摘要系统
AU2012327168B2 (en) Amethod and structure for managing multiple electronic forms and their records using a static database
CN105677638B (zh) Web信息抽取方法
CN102043819A (zh) Html表格语义脉络分析方法
CN104133868B (zh) 一种用于垂直爬虫数据分类整合的策略
CN104199938B (zh) 基于rss的农用土地信息发送方法和系统
CN103761264A (zh) 基于商品评论文档集的概念层次创建方法
Ra et al. The mixed ontology building methodology using database information
CN105975584A (zh) 一种数学表达式相似距离测量方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20151209

Termination date: 20161227

CF01 Termination of patent right due to non-payment of annual fee