CN112860940B - 基于描述逻辑知识库上有序概念空间的音乐资源检索方法 - Google Patents
基于描述逻辑知识库上有序概念空间的音乐资源检索方法 Download PDFInfo
- Publication number
- CN112860940B CN112860940B CN202110165946.3A CN202110165946A CN112860940B CN 112860940 B CN112860940 B CN 112860940B CN 202110165946 A CN202110165946 A CN 202110165946A CN 112860940 B CN112860940 B CN 112860940B
- Authority
- CN
- China
- Prior art keywords
- concept
- concepts
- knowledge base
- space
- ordered
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 45
- 238000004364 calculation method Methods 0.000 claims description 14
- 238000001514 detection method Methods 0.000 claims description 4
- 230000000694 effects Effects 0.000 claims description 3
- 230000011514 reflex Effects 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000004931 aggregating effect Effects 0.000 claims 1
- 239000002131 composite material Substances 0.000 claims 1
- 230000008520 organization Effects 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 8
- 238000012545 processing Methods 0.000 description 5
- 238000002372 labelling Methods 0.000 description 4
- 238000013459 approach Methods 0.000 description 2
- 238000010276 construction Methods 0.000 description 2
- WYROLENTHWJFLR-ACLDMZEESA-N queuine Chemical compound C1=2C(=O)NC(N)=NC=2NC=C1CN[C@H]1C=C[C@H](O)[C@@H]1O WYROLENTHWJFLR-ACLDMZEESA-N 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000717 retained effect Effects 0.000 description 1
- 238000013550 semantic technology Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/68—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/683—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/60—Information retrieval; Database structures therefor; File system structures therefor of audio data
- G06F16/63—Querying
- G06F16/638—Presentation of query results
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F17/00—Digital computing or data processing equipment or methods, specially adapted for specific functions
- G06F17/10—Complex mathematical operations
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Mathematical Physics (AREA)
- Algebra (AREA)
- Computational Mathematics (AREA)
- Mathematical Analysis (AREA)
- Mathematical Optimization (AREA)
- Pure & Applied Mathematics (AREA)
- Software Systems (AREA)
- Machine Translation (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本公开通过基于描述逻辑知识库和有序概念空间这两种手段,对于音乐此种难以深度检索的艺术资源,将其转换为知识库上的概念的查找,从而有利于实现一种新的检索系统,实现对音乐资源的深入检索。以此,本公开提出了一种基于描述逻辑知识库TBox逻辑结构的音乐资源组织和访问方式,通过定义满足偏序性质的TBox概念空间,建立有序的音乐资源集合,利用这种有序关系提供更加准确高效的音乐资源检索能力,弥补现有关键词检索文本信息系统的短板。
Description
技术领域
本公开涉及信息检索领域,特别涉及一种基于描述逻辑知识库上有序概念空间的音乐资源检索方法。
背景技术
音乐资源属于一种艺术类资源,其本身难以像普通文本信息那样进行精确的检索,这意味着当前百度、谷歌为代表的搜索引擎难以精准高效的检索此类资源。
随着近年语义技术的发展,如何利用描述逻辑的形式、通过开放关联数据的形式实现对此类资源的组织和访问,成为构建可检索化的数字世界的关键间题。
发明内容
鉴于此,本公开揭示了一种描述逻辑知识库上有序概念空间的音乐资源的检索方法,包括如下步骤:
S100、对于存储音乐资源的描述逻辑知识库,定义满足集合偏序性质的知识库上的有序概念空间,包括如下子步骤:
S1001、定义所述知识库的有序概念空间,其中,
所述有序概念空间包含:知识库中的所有原子概念和使用概念求精操作运算ρ(C)产生的合成概念;
其中,
将所述描述逻辑知识库中TBox定义的、不包含任何描述逻辑概念构造符的词汇记为原子词汇,并将原子词汇所描述的概念记为原子概念;
将所述描述逻辑知识库中合法的描述逻辑概念,和所述知识库所支持的描述逻辑概念构造符所产生的概念,记为合成概念;其中,
S1002、根据求精操作的性质,对知识库中的原子概念和利用求精操作运算生成的合成概念进行排序,以产生知识库上的概念空间的格结构,其中:每一对概念在概念空间中都可以找到他们的最小上界和最大下界;
其中,利用求精操作符的自反性和传递性定义概念空间上的偏序关系,以保证概念空间的有序性,使得对于任何一对概念C1和C2,都能够在概念空间上找到C1和C2的上界和下界;
S200、对所述概念空间中的每一个概念C,计算与其语义上相关概念集合SC,以使得所述知识库的ABox中每一个资源都使用相关概念集合SC上x一个概念进行了描述,具体包括如下子步骤:
S2001、利用所述偏序关系得到逻辑上语义相关的概念,以及同时属于不同概念的实例数量所蕴含的语义相关性,对每一个概念C分别计算其在逻辑上的相关概念集合CL和在实例数量上的相关概念集合CI,两者的交集CL∩CI则为与该概念C对应的相关概念集合SC;S300、将查询所述音乐资源的查询请求转化为:查询所述知识库有序概念空间上的查询请求概念CQ,具体包括:
对于以查询关键词方式提交的所述音乐资源的查询请求,在语法上将其和知识库有序概念空间中的概念名称进行字符串匹配,找到与所述查询关键词具有最大相似性的概念名称,将该概念作为查询请求概念CQ;
S400、在所述步骤S200计算所得的相关概念集合SC中查找与查询请求概念CQ相关的概念集合SCQ,并从知识库ABox中查找使用SCQ中的概念描述的资源实例作为查询的结果。
优选的,
关于有序概念空间中的每一个概念C的求精操作运算ρ(C)定义如下:
其中,ρB(C)上述公式中的:
A,C,Ci,D表示知识库的TBox中的概念,
NC表示知识库的TBox中概念的集合,
r,s表示知识库中描述音乐资源的属性的定义彼此之间的关系,
NR表示所述关系的集合,
ρB(C)中出现的操作的含义定义如下:
优选的,所述于步骤S2001包括如下步骤:
S1:将ρ(C)的计算结果存入集合LogicRelevant;
S2:将候选上界概念集合upperCandidates和候选下界概念集合lowerCandidates的初值都设为LogicRelevant;
S4:从候选的上界概念集合upperCandidates中选择概念Ci和Cj;利用概念空间上的偏序关系计算lgg(Ci,Cj),即Ci和Cj的最小上界,将lgg(Ci,Cj)的计算结果同时并入集合upperCandidates和集合LogicRelevant;
S5:将概念Ci和Cj从集合upperCandidates中删除,并回到步骤S3;
S6:如果知识库中最特殊的概念⊥不在lowerCandidates中且集合lowerCandidates中的元素个数大于1,则执行步骤S7,否则执行步骤S10;
S7:从集合lowerCandidates中选择概念Ci和Cj,利用概念空间上的偏序关系计算mgs(Ci,Cj),即Ci和Cj的最大下界,将mgs(Ci,Cj)的计算结果同时并入集合lowerCandidates和集合LogicRelevant;
S8:将Ci和Cj从集合lowerCandidates中删除,并回到步骤S6;
S9:上界概念upperConcept赋值为候选的上界概念集合upperCandidates中的最后一个元素,下界概念lowerConcept赋值为候选的下界概念集合lowerCandidates中的最后一个元素,集合LogicRelevant赋值为前述步骤S1的LogicRelevant、{upperConcept}和{lowerConcept}的并集;
S10:利用求精操作符ρ计算ρ(upperConcept),并将其计算结果并入集合LogicRelevant;
S11:对于LogicRelevant中的每一个概念Clog,在集合C中存在一个概念CE使得p(CE|Clog)≥t或者p(Clog|CE)≥t,则将Clog并入LogicRelevant以得到最终的LogicRelevant,并以此作为相关概念集合SC,其中t为设定的条件概率阈值,其中:
Instance(C)表示知识库中概念C的实例个数,即使用概念C对资源进行语义描述的资源数量;假设概念C′和C在同一条求精链上且有则p(C|C′)=1成立,因为C′和C之间具有确定的包含关系;因此条件概率的计算可简化为若概念C′和C不在同一条求精链上,可先根据概念空间中的偏序关系找到C′和c的最小上界Igg(C,C′),再计算p(lgg(C,C′)|C′);
S12:返回最终的相关概念集合SC。
对于该实施例而言,其充分利用了现有的数学知识,将其创造性的用于音乐资源,进行数据处理,从而给出了本公开所述的相关概念集合SC的实施方式。能够理解,本公开的发明构思并不应当受限于具体的数据处理手段。
优选的,步骤S12之后还包括如下步骤:
S13、除了上界upperConcept和下界lowerConcept,所述计算过程中保留计算上界和下界过程中的中间结果,将其保存到集合StrucRelevant中,其中,集合StrucRelevant中的概念是与上界upperConcept和下界lowerConcept有直接包含关系的概念。
以此,本公开提出了一种基于描述逻辑知识库TBox逻辑结构的音乐资源组织和访问方式,通过定义满足偏序性质的TBox概念空间,建立有序的音乐资源集合,利用这种有序关系提供更加准确高效的音乐资源检索能力,弥补现有关键词检索文本信息系统的短板。
附图说明
图1为本公开一个实施例中所述方法的示意图;
图2为本公开一个实施例中所述关键步骤的示意图;
图3为本公开一个实施例中原子概念顺序关系示意图;
图4为本公开一个实施例中原子属性顺序关系示意图;
图5为本公开一个实施例中民间音乐资源有序概念空间结构说明图;
图6为本公开一个实施例中求精操作运算的示意图;
图7为本公开一个实施例中有序概念空间中相关性概念的示意图;
图8为本公开一个实施例中使用有序概念空间中的原子概念和复杂构造型概念对资源进行语义标注的示意图;
图9为本公开构造ABox过程的示意图。
具体实施方式
为了使本领域技术人员理解本公开所披露的技术方案,下面将结合实施例及有关附图1至图9,对各个实施例的技术方案进行描述,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。本公开所采用的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,“包括”和“具有”以及它们的任何变形,意图在于覆盖且不排他的包含。例如包含了一系列步骤或单元的过程、或方法、或系统、或产品或设备没有限定于已列出的步骤或单元,而是可选的还包括没有列出的步骤或单元,或可选的还包括对于这些过程、方法、系统、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本公开的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员可以理解的是,本文所描述的实施例可以与其他实施例相结合。
参见图1,在一个实施例中,本公开揭示了一种描述逻辑知识库上有序概念空间的音乐资源的检索方法,包括如下步骤:
S100、对于存储音乐资源的描述逻辑知识库,定义满足集合偏序性质的知识库上的有序概念空间,包括如下子步骤:
S1001、定义所述知识库的有序概念空间,其中,
所述有序概念空间包含:知识库中的所有原子概念和使用概念求精操作运算ρ(C)产生的合成概念;
其中,
将所述描述逻辑知识库中TBox定义的、不包含任何描述逻辑概念构造符的词汇记为原子词汇,并将原子词汇所描述的概念记为原子概念;
将所述描述逻辑知识库中合法的描述逻辑概念,和所述知识库所支持的描述逻辑概念构造符所产生的概念,记为合成概念;其中,
S1002、根据求精操作的性质,对知识库中的原子概念和利用求精操作运算生成的合成概念进行排序,以产生知识库上的概念空间的格结构,其中:每一对概念在概念空间中都可以找到他们的最小上界和最大下界;
其中,利用求精操作符的自反性和传递性定义概念空间上的偏序关系,以保证概念空间的有序性,使得对于任何一对概念C1和C2,都能够在概念空间上找到C1和C2的上界和下界;
S200、对所述概念空间中的每一个概念C,计算与其语义上相关概念集合SC,以使得所述知识库的ABox中每一个资源都使用相关概念集合SC上的一个概念进行了描述,具体包括如下子步骤:
S2001、利用所述偏序关系得到逻辑上语义相关的概念,以及同时属于不同概念的实例数量所蕴含的语义相关性,对每一个概念C分别计算其在逻辑上的相关概念集合CL和在实例数量上的相关概念集合CI,两者的交集CL∩CI则为与该概念C对应的相关概念集合SC;S300、将查询所述音乐资源的查询请求转化为:查询所述知识库有序概念空间上的查询请求概念CQ,具体包括:
对于以查询关键词方式提交的所述音乐资源的查询请求,在语法上将其和知识库有序概念空间中的概念名称进行字符串匹配,找到与所述查询关键词具有最大相似性的概念名称,将该概念作为查询请求概念CQ;
S400、在所述步骤S200计算所得的相关概念集合SC中查找与查询请求概念CQ相关的概念集合SCQ,并从知识库ABox中查找使用SCQ中的概念描述的资源实例作为查询的结果。
本实施例通过基于描述逻辑知识库和有序概念空间这两种手段,对于音乐此种难以深度检索的艺术资源,将其转换为知识库上的概念的查找,从而有利于实现一种新的检索系统,实现对音乐资源的深入检索。
能够理解,在知识库ABox中,本实施例实现了每一个资源都使用知识库概念空间上相关概念集合SC中的一个概念进行了描述,因此,找到ABox中所有出现在SCQ中的概念所描述的资源,这些资源就是满足用户查询请求的资源。
具体而言,本公开的基本思路是:通过定义音乐资源知识库概念空间上的偏序结构,提出了基于有序概念建立音乐资源知识库的思想和有序资源空间上的相关资源的检索方法,该方法将建立基于有序描述逻辑的音乐资源知识库分为如下关键步骤:
(1)定义音乐领域中的核心词汇,构建知识库的Tbox;
(2)定义满足集合偏序性质的音乐概念空间,构造TBox上的有序关系;
(3)对概念空间中的每一个概念,计算与其语义上相关的一组概念;
(4)对于每一个音乐资源,使用一组相关资源对其进行语义标注,构建知识库的Abox。
当然,不言而喻的,出于知识库的必然要求,每一个步骤均要保证资源知识库上的实体以满足开放关联数据要求的形式描述。
在另一个实施例中,
关于有序概念空间中的每一个概念C的求精操作运算ρ(C)定义如下:
其中,ρB(C)上述公式中的:
A,C,Ci,D表示知识库的TBox中的概念,
NC表示知识库的TBox中概念的集合,
r,s表示知识库中描述音乐资源的属性的定义彼此之间的关系,
NR表示所述关系的集合,
ρB(C)中出现的操作的含义定义如下:
对于上述实施例,其充分利用了知识库和逻辑概念以及标准集合操作,将其创新性的用于音乐资源的检索。
在另一个实施例中,所述子步骤S2001包括如下步骤:
S1:将ρ(C)的计算结果存入集合LogicRelevant;
S2:将候选上界概念集合upperCandidates和候选下界概念集合lowerCandidates的初值都设为LogicRelevant;
S4:从候选的上界概念集合upperCandidates中选择概念Ci和Cj;利用概念空间上的偏序关系计算lgg(Ci,Cj),即Ci和Cj的最小上界,将lgg(Ci,Cj)的计算结果同时并入集合upperCandidates和集合LogicRelevant;
S5:将概念Ci和Cj从集合upperCandidates中删除,并回到步骤S3;
S6:如果知识库中最特殊的概念⊥不在lowerCandidates中且集合lowerCandidates中的元素个数大于1,则执行步骤S7,否则执行步骤S10;
S7:从集合lowerCandidates中选择概念Ci和Cj,利用概念空间上的偏序关系计算mgs(Ci,Cj),即Ci和Cj的最大下界,将mgs(Ci,Cj)的计算结果同时并入集合lowerCandidates和集合LogicRelevant;
S8:将Ci和Cj从集合lowerCandidates中删除,并回到步骤s6;
S9:上界概念upperConcept赋值为候选的上界概念集合upperCandidates中的最后一个元素,下界概念lowerConcept赋值为候选的下界概念集合lowerCandidates中的最后一个元素,集合LogicRelevant赋值为前述步骤S1的LogicRelevant、{upperConcept}和{lowerConcept}的并集;
S10:利用求精操作符ρ计算ρ(upperConcept),并将其计算结果并入集合LogicRelevant;
S11:对于LogicRelevant中的每一个概念Clog,在集合C中存在一个概念CE使得p(CE|Clog)≥t或者p(Clog|CE)≥t,则将Clog并入LogicRelevant以得到最终LogicRelevant,并以此作为相关概念集合SC,其中t为设定的条件概率阈值,其中:
Instance(C)表示知识库中概念C的实例个数,即使用概念C对资源进行语义描述的资源数量;假设概念C′和C在同一条求精链上且有则p(C|C′)=1成立,因为C′和C之间具有确定的包含关系;因此条件概率的计算可简化为若概念C′和C不在同一条求精链上,可先根据概念空间中的偏序关系找到C′和C的最小上界Igg(C,C′),再计算p(lgg(C,C′)|C′).
S12:返回最终的相关概念集合SC。
对于该实施例而言,其充分利用了现有的数学知识,将其创造性的用于音乐资源,进行数据处理,从而给出了本公开所述的相关概念集合SC的实施方式。能够理解,本公开的发明构思并不应当受限于具体的数据处理手段。
进一步的,对集合LogicRelevant进行扩展,使其包含:在知识库中从语义层面与样本高度相关的概念。由于求精操作在其操作过程中,是给对应的初始概念上添加新的概念和关系,所以扩展方法是对以上界upperConcept为初始概念进行求精操作,从得到的结果中进一步选择语义相关的概念,并对每一个逻辑上相关的概念使用条件概率阈值t进行筛选,获得最终的相关概念集合Sc。
在另一个实施例中,步骤S12之后还包括如下步骤:
S13、除了上界upperConcept和下界lowerConcept,所述计算过程中保留计算上界和下界过程中的中间结果,将其保存到集合StrucRelevant中,其中,集合StrucRelevant中的概念是与上界upperConcept和下界IowerConcept有直接包含关系的概念。
能够理解,中间结果不仅可以用于此类音乐资源的检索,而且可以通过中间结果不断优化本检索方法及其系统。根源在于:中间结果所对应的集合中的元素,反映了与上界和下界集合中某些概念的包含关系,这完全可以用于信息的检索。
正是在前述实施例的的基础上,本公开与现有技术相比,具有以下优点:
第一,由于本公开考虑到了领域概念集合上的顺序,构造了一个易于理解且易于实现的领域概念空间,因此将领域中的资源也有序地组织了起来,更加有利于资源集合的浏览和可视化。无论是人还是机器都可以方便地全面浏览知识库上的资源,确定与需求相关的资源子集。
第二,由于本公开考虑了有序领域概念空间上包含的所有类型概念,包括原子概念以及使用描述逻辑构造符生成的复杂概念,因此用于标注资源的概念既有原子概念,也有复杂概念,实现了对资源的精确标注,知识库中对于个体资源的描述就更加准确丰富,对于复杂的查询条件,精确的标注可以提供更加准确的资源检索服务;
第三,由于本公开考虑了基于领域概念空间逻辑结构的概念相关性,提出了计算概念空间上一组相关性概念的方法,并将此方法用于资源检索过程,因此可以有效提高资源检索结果的正确率和召回率。
以下,以中国民间音乐为例,参见图2,在另一个实施例中,本公开给出前述关键几个步骤的更加具体、细化的实施例:
步骤一:定义民间音乐领域中的核心词汇,构造TBox;
中国民间音乐知识库中的词汇来源于两种:音乐本体MusicOntology中关于音乐的一般概念和属性的描述(例如借鉴http://musicontology.com/specification/中Summary of Terms,Classed,Properties,Individua1s中所列出的词汇);以及针对中国民间音乐特征的概念和属性,这部分词汇可以来源于人工的标注。
步骤二:定义满足集合偏序性质的民间音乐概念空间;
首先定义中国民间音乐知识库上的有序概念:
定义1(有序概念)知识库上的一个有序概念是一个概念序列C1,C2,...Cn并记为Ci(1≤i≤n)具有以下形式之一:(1)Ci=A; 其中A,E,为中的原子概念或者是满足定义1的描述逻辑概念,r是上的关系;操作符表示生成概念的描述逻辑构造符.由C1,C2,...,Cn构成的但不考虑其出现次序的概念记为C;
有序概念包括原子概念和通过描述逻辑构造符生成的复杂构造概念。关于构造概念的生成的相关概念定义如下:
定义2(求精操作符)拟序描述了一种具有自反性和传递性的关系
在一个拟序空间中一个向下求精操作(downward refinement operator)符ρ是一个从S到2S的映射,对于所有C∈S有C′∈ρ(C)蕴含着C′≤C(或C≥C′).C′称为对C的特化。
同理可以定义向上求精操作符;
定义4(求精链)关于求精操作符ρ的一个长度为n的从概念C到概念D的求精链是一个有限的概念序列C0,C1,...,Cn,C=C0,C1∈ρ(C0),C2∈ρ(C1),...,Cn∈ρ(Cn-1),D=Cn.求精链经过概念E当且仅当存在i(1≤i≤n)满足E=Ci.如果存在一条从概念C到D的求精链,则称从概念C通过ρ可到达D.ρ*(C)表示从C开始通过ρ可到达的所有概念.ρm(C)表示从C开始通过长度为m的ρ的求精链可到达的所有概念;
在本公开中,将复杂的构造型概念定义为从知识库上的原子概念C开始利用合法的求精操作符所产生的求精链上的所有概念。本公开所使用的关于概念C的求精操作运算ρB(C)定义如下:
步骤三:对概念空间中的每一个概念,计算与其语义上相关的一组概念;
在知识库上,与某一概念在语义上相关的一组概念可以通过如下算法得到:
算法1:搜索逻辑结构上的相关概念
1.输入:描述逻辑知识库K,样本概念C;
2.输出:上界概念upperConcept,下界概念lowerConcept,结构相关概念集合StrucRelevant;
4.upperCandidates=C;
5.lowerCandidates=C;
7.从upperCandidates中选择概念Ci和Cj;
8.upperCandidates=upperCandidates∪lgg(Ci,Cj);
9.StrucRelevant=StrucRelevant∪lgg(Ci,Cj);
10.remove Ci,Cjfrom upperCandidates;
11.endwhile
12.while(⊥is not in lowerCandidates and|lowerCandidates|>1)
13.从lowerCandidates中选择概念Ci和Cj;
14.lowerCandidates=lowerCandidates∪mgs(Ci,Cj);
15.StrucRelevant=StrucRelevant∪lgg(Ci,Cj);
16.remove Ci,Cj from lowerCandidates;
17.endwhile
18.upperConcept=upperCandidates中的最后一个元素;
19.lowerConcept=lowerCandidates中的最后一个元素;
20.StrucRelevant=StrucRelevant∪{upperConcept}∪{lowerConcept};
21.return upperConcept,lowerConcept,StrucRelevant;
在算法1中,除了关于正样本的上界upperConcept和下界lowerConcept,计算过程中保留计算上界和下界过程中的中间结果,将其保存到集合StrucRelevant中.StrucRelevant中的概念比upperConcept更特殊,比lowerConcept更一般,是与upperConcept和lowerConcept有直接包含关系的概念,所以确定其为相关概念。
进一步,在算法1的基础上,对StrucRelevant进行扩展,使其包含在知识库中从语义层面与样本高度相关的概念。由于求精操作可以在其操作对应的初始概念上添加新的概念和关系,所以扩展方法是对以upperConcept为初始概念进行求精操作,从得到的结果中进一步选择语义相关的概念.同时对每一个逻辑结构上相关的概念使用条件概率阈值进行筛选,获得最终的相关概念集合。这一过程如算法2所示:
算法2相关概念的选择
input:来自算法1的upperConcept,lowerConcept,StrucRelevant;
output:相关概念集合RelevantConcept
2.refinements=refine(upperConcept);//对upperConcept进行求精操作,以发现与样本语义上相容的概念描述
3.StrucRelevant=StrucRelevant∪refinements
4.for each concept Cstru in StrucRelevant
5.for each concept CEthat cover a positive example
6.if(p(CE|Cstru)≥t or p(Cstru|CE)≥t)
7.RelevantConcept=RelevantConcept∪{Cstru};
8.return RelevantConcept;
对于概念和C,两者具有相同的实例集合,将直接使用p(C)来表达概念对应的量化值.在描述逻辑模型论语义的环境下,计算p(C)的值可以转化为描述逻辑知识库中的实例检测问题,即满足概念C的实例数量与知识库中总实例(个体总数)的比值.假设概念C′和C在同一条求精链上且有则p(C|C′)=1成立,因为C′和C之间具有确定的包含关系.因此条件概率的计算可简化为对于概念搜索空间上的有序概念,
步骤四:对于每一个音乐资源,使用一组相关资源对其进行语义标注,构造民间音乐资源知识库库的ABox;
资源的语义标注是一个结合了人工标注和自动标注的混合式的标注过程。对于人工提供了语义标签的资源,将标签理解为知识库中的概念,利用算法1和算法2,找出与该资源相关的一组概念,做为其语义描述;对于没有人工标签的资源,根据资源的名称,通过百度百科、维基百科和搜索引擎获取资源的描述信息,从描述信息中查找与概念空间中的概念相匹配的描述,如果存在这样的描述,则使用相应匹配的概念对该资源进行语义描述。
本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作、步骤,乃至其对应的模块、单元并不一定是本公开所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本公开所提供的几个实施例中,应该理解到,所揭露的方法,可实现为对应的功能单元、处理器乃至系统,其中所述系统的各部分既可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,各功能单元可以集成在一个处理单元中,也可以是各个单元单独存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为智能手机、个人数字助理、可穿戴设备、笔记本电脑、平板电脑)执行本公开的各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开的各实施例技术方案的范围。
Claims (3)
1.基于描述逻辑知识库上有序概念空间的音乐资源检索方法,包括如下步骤:
S100、对于存储音乐资源的描述逻辑知识库,定义满足集合偏序性质的知识库上的有序概念空间,包括如下子步骤:
S1001、定义所述知识库的有序概念空间,其中,
其中,
将所述描述逻辑知识库中TBox定义的、不包含任何描述逻辑概念构造符的词汇记为原子词汇,并将原子词汇所描述的概念记为原子概念;
将所述描述逻辑知识库中合法的描述逻辑概念,和所述知识库所支持的描述逻辑概念构造符所产生的概念,记为合成概念;其中,
S1002、根据求精操作的性质,对知识库中的原子概念和利用求精操作运算生成的合成概念进行排序,以产生知识库上的概念空间的格结构,其中:每一对概念在概念空间中都能够找到他们的最小上界和最大下界;
其中,利用求精操作符的自反性和传递性定义概念空间上的偏序关系,以保证概念空间的有序性,使得对于任何一对概念C 1和C 2,都能够在概念空间上找到C 1和C 2的上界和下界;
S200、对所述概念空间中的每一个概念C,计算与其语义上相关概念集合S C ,以使得所述知识库的ABox中每一个资源都使用相关概念集合S C 上的一个概念进行了描述,具体包括如下子步骤:
S2001、利用所述偏序关系得到逻辑上语义相关的概念,以及同时属于不同概念的实例
数量所蕴含的语义相关性,对每一个概念C分别计算其在逻辑上的相关概念集合C L和在实
例数量上的相关概念集合C I,两者的交集则为与该概念C对应的相关概念集合S C ;
S300、将查询所述音乐资源的查询请求转化为:查询所述知识库有序概念空间上的查询请求概念C Q,具体包括:
对于以查询关键词方式提交的所述音乐资源的查询请求,在语法上将其和知识库有序概念空间中的概念名称进行字符串匹配,找到与所述查询关键词具有最大相似性的概念名称,将该概念作为查询请求概念C Q;
S400、在所述步骤S200计算所得的相关概念集合S C 中查找与查询请求概念C Q相关的概念集合SC Q,并从知识库ABox中查找使用SC Q中的概念描述的资源实例作为查询的结果;
这是因为:在知识库ABox中,每一个资源都使用知识库概念空间上相关概念集合S C 中的一个概念进行了描述,因此,找到ABox中所有出现在SC Q中的概念所描述的资源,这些资源就是满足用户查询请求的资源;
其中,
A,C,C i ,D表示知识库的TBox中的概念,
N C 表示知识库的TBox中概念的集合,
r,s表示知识库中描述音乐资源的属性的定义彼此之间的关系,
N R 表示所述关系的集合,
其中:
2.根据权利要求1所述的方法,其特征在于,所述子步骤S2001包括如下步骤:
S2:将候选上界概念集合upperCandidates和候选下界概念集合lowerCandidates的初值都设为LogicRelevant;
S4:从候选的上界概念集合upperCandidates中选择概念C i 和 C j ;利用概念空间上的偏序关系计算lgg(C i , C j ),即C i 和C j 的最小上界,将lgg(C i , C j )的计算结果同时并入集合upperCandidates和集合LogicRelevant ;
S5:将概念C i 和 C j 从集合upperCandidates中删除,并回到步骤S3;
S7:从集合lowerCandidates中选择概念C i 和 C j ,利用概念空间上的偏序关系计算mgs(C i , C j ),即C i 和 C j 的最大下界,将mgs(C i , C j )的计算结果同时并入集合lowerCandidates和集合LogicRelevant;
S8:将C i 和C j 从集合lowerCandidates中删除,并回到步骤S6;
S9:上界概念upperConcept赋值为候选的上界概念集合upperCandidates中的最后一个元素,下界概念lowerConcept赋值为候选的下界概念集合lowerCandidates中的最后一个元素,集合LogicRelevant 赋值为前述步骤S1的LogicRelevant、{upperConcept}和{lowerConcept}的并集;
S11:对于LogicRelevant中的每一个概念Clog,在集合C中存在一个概念CE使得 或者,则将Clog并入LogicRelevant以得到最终的LogicRelevant,并以此作为相关概念集合S C ,其中t为设定的条件概率阈值,其中:
Instance(C)表示知识库中概念C的实例个数,即使用概念C对资源进行语义描述的资
源数量;假设概念C' 和C在同一条求精链上且有,则成立, 因为C' 和C
之间具有确定的包含关系;因此条件概率的计算简化为;
S12:返回最终的相关概念集合S C 。
3.根据权利要求2所述的方法,其特征在于,步骤S12之后还包括如下步骤:
S13、除了上界upperConcept 和下界lowerConcept,计算过程中保留计算上界和下界过程中的中间结果,将其保存到集合StrucRelevant中,其中,集合StrucRelevant中的概念是与上界upperConcept 和下界lowerConcept有直接包含关系的概念。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110165946.3A CN112860940B (zh) | 2021-02-05 | 2021-02-05 | 基于描述逻辑知识库上有序概念空间的音乐资源检索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202110165946.3A CN112860940B (zh) | 2021-02-05 | 2021-02-05 | 基于描述逻辑知识库上有序概念空间的音乐资源检索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112860940A CN112860940A (zh) | 2021-05-28 |
CN112860940B true CN112860940B (zh) | 2022-11-25 |
Family
ID=75988799
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202110165946.3A Active CN112860940B (zh) | 2021-02-05 | 2021-02-05 | 基于描述逻辑知识库上有序概念空间的音乐资源检索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112860940B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2865055A1 (fr) * | 2004-01-12 | 2005-07-15 | Thomson Licensing Sa | Base de connaissance ontologique et procede d'extraction d'informations a partir d'une requete en langage naturel. |
CN101566988A (zh) * | 2008-04-24 | 2009-10-28 | 华为技术有限公司 | 一种模糊语义搜索方法、系统及设备 |
CN101706792A (zh) * | 2009-11-27 | 2010-05-12 | 河南大学 | 一种面向中文查询句的三级查询目标分析方法 |
KR20130064226A (ko) * | 2011-12-08 | 2013-06-18 | 숭실대학교산학협력단 | 시맨틱 웹에서 관계형 데이터베이스를 owl 온톨로지로 사용하기 위한 질의처리장치 및 방법 |
CN109087223A (zh) * | 2018-08-03 | 2018-12-25 | 广州大学 | 一种基于本体的教育资源模型构建方法 |
Family Cites Families (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20070078889A1 (en) * | 2005-10-04 | 2007-04-05 | Hoskinson Ronald A | Method and system for automated knowledge extraction and organization |
US8024329B1 (en) * | 2006-06-01 | 2011-09-20 | Monster Worldwide, Inc. | Using inverted indexes for contextual personalized information retrieval |
CN103049555B (zh) * | 2012-12-30 | 2016-03-02 | 中国人民解放军国防科学技术大学 | 保证语义正确性的动态分层集成数据访问方法 |
EP2966600B1 (en) * | 2014-07-07 | 2018-08-15 | derivo GmbH | Abstraction refinement for scalable type reasoning in ontology-based data repositories |
CN106815279A (zh) * | 2016-09-30 | 2017-06-09 | 京华信息科技股份有限公司 | 基于本体的政务知识检索系统 |
-
2021
- 2021-02-05 CN CN202110165946.3A patent/CN112860940B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
FR2865055A1 (fr) * | 2004-01-12 | 2005-07-15 | Thomson Licensing Sa | Base de connaissance ontologique et procede d'extraction d'informations a partir d'une requete en langage naturel. |
CN101566988A (zh) * | 2008-04-24 | 2009-10-28 | 华为技术有限公司 | 一种模糊语义搜索方法、系统及设备 |
CN101706792A (zh) * | 2009-11-27 | 2010-05-12 | 河南大学 | 一种面向中文查询句的三级查询目标分析方法 |
KR20130064226A (ko) * | 2011-12-08 | 2013-06-18 | 숭실대학교산학협력단 | 시맨틱 웹에서 관계형 데이터베이스를 owl 온톨로지로 사용하기 위한 질의처리장치 및 방법 |
CN109087223A (zh) * | 2018-08-03 | 2018-12-25 | 广州大学 | 一种基于本体的教育资源模型构建方法 |
Non-Patent Citations (4)
Title |
---|
Knowledge reasoning and Tableau Algorithm improving based on rough description logics;Hongcan Yan etc.;《2012 9th International Conference on Fuzzy Systems and Knowledge Discovery》;20120709;第2697-2701页 * |
基于描述逻辑的概念图推理;王军等;《计算机科学》;20080825(第08期);第176-179页 * |
基于本体和描述逻辑的SWRL推理研究;初林洁;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20150115;第I139-130页 * |
融合规则推理的工程知识图语义查询;王耀辉;《中国优秀硕士学位论文全文数据库(信息科技辑)》;20200215;第I138-2444页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112860940A (zh) | 2021-05-28 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20220382752A1 (en) | Mapping Natural Language To Queries Using A Query Grammar | |
US11720572B2 (en) | Method and system for content recommendation | |
US11593438B2 (en) | Generating theme-based folders by clustering digital images in a semantic space | |
CN110019732B (zh) | 一种智能问答方法以及相关装置 | |
JP5423030B2 (ja) | ワードセットに関係するワードの決定 | |
US7788265B2 (en) | Taxonomy-based object classification | |
JP7252914B2 (ja) | 検索提案を提供する方法、装置、機器及び媒体 | |
CN111680173A (zh) | 统一检索跨媒体信息的cmr模型 | |
US10552467B2 (en) | System and method for language sensitive contextual searching | |
US10387469B1 (en) | System and methods for discovering, presenting, and accessing information in a collection of text contents | |
CN113190687B (zh) | 知识图谱的确定方法、装置、计算机设备及存储介质 | |
WO2014054052A2 (en) | Context based co-operative learning system and method for representing thematic relationships | |
CN107844493B (zh) | 一种文件关联方法及系统 | |
CN111061828B (zh) | 一种数字图书馆知识检索方法及装置 | |
CN115563313A (zh) | 基于知识图谱的文献书籍语义检索系统 | |
KR101441219B1 (ko) | 정보 엔터티들의 자동 연관 | |
WO2023151576A1 (zh) | 搜索推荐方法、搜索推荐系统、计算机设备及存储介质 | |
US20120130999A1 (en) | Method and Apparatus for Searching Electronic Documents | |
TWI290687B (en) | System and method for search information based on classifications of synonymous words | |
Kambau et al. | Concept-based multimedia information retrieval system using ontology search in cultural heritage | |
KR101602342B1 (ko) | 의미 태깅된 자연어 질의의 의도에 부합하는 정보 추출 및 제공 방법 및 시스템 | |
Hybridised | OntoKnowNHS: Ontology Driven Knowledge Centric Novel Hybridised Semantic Scheme for Image Recommendation Using Knowledge Graph | |
CN112860940B (zh) | 基于描述逻辑知识库上有序概念空间的音乐资源检索方法 | |
Khan | Processing big data with natural semantics and natural language understanding using brain-like approach | |
JP7438272B2 (ja) | 検索インテント単位のブロックを生成する方法、コンピュータ装置、およびコンピュータプログラム |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |