CN112860940A - 基于描述逻辑知识库上有序概念空间的音乐资源检索方法 - Google Patents

基于描述逻辑知识库上有序概念空间的音乐资源检索方法 Download PDF

Info

Publication number
CN112860940A
CN112860940A CN202110165946.3A CN202110165946A CN112860940A CN 112860940 A CN112860940 A CN 112860940A CN 202110165946 A CN202110165946 A CN 202110165946A CN 112860940 A CN112860940 A CN 112860940A
Authority
CN
China
Prior art keywords
concept
concepts
knowledge base
space
bound
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202110165946.3A
Other languages
English (en)
Other versions
CN112860940B (zh
Inventor
袁柳
吴晓军
李鹏
路纲
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shaanxi Normal University
Original Assignee
Shaanxi Normal University
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shaanxi Normal University filed Critical Shaanxi Normal University
Priority to CN202110165946.3A priority Critical patent/CN112860940B/zh
Publication of CN112860940A publication Critical patent/CN112860940A/zh
Application granted granted Critical
Publication of CN112860940B publication Critical patent/CN112860940B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/68Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/683Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/60Information retrieval; Database structures therefor; File system structures therefor of audio data
    • G06F16/63Querying
    • G06F16/638Presentation of query results
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/10Complex mathematical operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Library & Information Science (AREA)
  • Mathematical Physics (AREA)
  • Algebra (AREA)
  • Computational Mathematics (AREA)
  • Mathematical Analysis (AREA)
  • Mathematical Optimization (AREA)
  • Pure & Applied Mathematics (AREA)
  • Software Systems (AREA)
  • Machine Translation (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本公开通过基于描述逻辑知识库和有序概念空间这两种手段,对于音乐此种难以深度检索的艺术资源,将其转换为知识库上的概念的查找,从而有利于实现一种新的检索系统,实现对音乐资源的深入检索。以此,本公开提出了一种基于描述逻辑知识库TBox逻辑结构的音乐资源组织和访问方式,通过定义满足偏序性质的TBox概念空间,建立有序的音乐资源集合,利用这种有序关系提供更加准确高效的音乐资源检索能力,弥补现有关键词检索文本信息系统的短板。

Description

基于描述逻辑知识库上有序概念空间的音乐资源检索方法
技术领域
本公开涉及信息检索领域,特别涉及一种基于描述逻辑知识库上有序概念空间的音乐资源检索方法。
背景技术
音乐资源属于一种艺术类资源,其本身难以像普通文本信息那样进行精确的检索,这意味着当前百度、谷歌为代表的搜索引擎难以精准高效的检索此类资源。
随着近年语义技术的发展,如何利用描述逻辑的形式、通过开放关联数据的形式实现对此类资源的组织和访问,成为构建可检索化的数字世界的关键间题。
发明内容
鉴于此,本公开揭示了一种描述逻辑知识库上有序概念空间的音乐资源的检索方法,包括如下步骤:
S100、对于存储音乐资源的描述逻辑知识库,定义满足集合偏序性质的知识库上的有序概念空间,包括如下子步骤:
S1001、定义所述知识库的有序概念空间,其中,
所述有序概念空间包含:知识库中的所有原子概念和使用概念求精操作运算ρ(C)产生的合成概念;
其中,
将所述描述逻辑知识库中TBox定义的、不包含任何描述逻辑概念构造符的词汇记为原子词汇,并将原子词汇所描述的概念记为原子概念;
将所述描述逻辑知识库中合法的描述逻辑概念,和所述知识库所支持的描述逻辑概念构造符所产生的概念,记为合成概念;其中,
使用概念求精操作运算ρ(C)自动地产生合成概念,且求精操作可保持所产生的合成概念的顺序关系,即对于概念C’∈ρ(C),有
Figure BDA0002935726410000011
S1002、根据求精操作的性质,对知识库中的原子概念和利用求精操作运算生成的合成概念进行排序,以产生知识库上的概念空间的格结构,其中:每一对概念在概念空间中都可以找到他们的最小上界和最大下界;
其中,利用求精操作符的自反性和传递性定义概念空间上的偏序关系,以保证概念空间的有序性,使得对于任何一对概念C1和C2,都能够在概念空间上找到C1和C2的上界和下界;
S200、对所述概念空间中的每一个概念C,计算与其语义上相关概念集合SC,以使得所述知识库的ABox中每一个资源都使用相关概念集合SC上x一个概念进行了描述,具体包括如下子步骤:
S2001、利用所述偏序关系得到逻辑上语义相关的概念,以及同时属于不同概念的实例数量所蕴含的语义相关性,对每一个概念C分别计算其在逻辑上的相关概念集合CL和在实例数量上的相关概念集合CI,两者的交集CL∩CI则为与该概念C对应的相关概念集合SC;S300、将查询所述音乐资源的查询请求转化为:查询所述知识库有序概念空间上的查询请求概念CQ,具体包括:
对于以查询关键词方式提交的所述音乐资源的查询请求,在语法上将其和知识库有序概念空间中的概念名称进行字符串匹配,找到与所述查询关键词具有最大相似性的概念名称,将该概念作为查询请求概念CQ
S400、在所述步骤S200计算所得的相关概念集合SC中查找与查询请求概念CQ相关的概念集合SCQ,并从知识库ABox中查找使用SCQ中的概念描述的资源实例作为查询的结果。
优选的,
关于有序概念空间中的每一个概念C的求精操作运算ρ(C)定义如下:
Figure BDA0002935726410000021
其含义是:对概念C进行求精操作ρ,如果C为所述知识库中的最一般概念
Figure BDA0002935726410000025
则ρ(C)的结果是
Figure BDA0002935726410000022
否则ρ(C)的结果为
Figure BDA0002935726410000023
其中,
Figure BDA0002935726410000024
的计算根据如下定义的ρB(C)的计算公式确定:
Figure BDA0002935726410000031
其中,ρB(C)上述公式中的:
A,C,Ci,D表示知识库的TBox中的概念,
NC表示知识库的TBox中概念的集合,
r,s表示知识库中描述音乐资源的属性的定义彼此之间的关系,
NR表示所述关系的集合,
Figure BDA0002935726410000032
Figure BDA0002935726410000033
为知识库上使用的标准的描述逻辑知识库概念构造运算符,
ρB(C)中出现的操作的含义定义如下:
Figure BDA0002935726410000034
其中A”就是一个符号,区分A,A’,A”是不同的概念,这是标准的集合操作上的约束的表示,本身具有清楚明确的含义;
Figure BDA0002935726410000035
用于强调作用在有序概念空间上包含关系;
Figure BDA0002935726410000036
Figure BDA0002935726410000037
Figure BDA0002935726410000041
ad(r)为NC中的概念A且满足
Figure BDA0002935726410000042
不存在A’使得
Figure BDA0002935726410000043
Figure BDA0002935726410000044
其中(domain(r)表示关系r的定义域);
Figure BDA0002935726410000045
Figure BDA0002935726410000046
均是标准的描述逻辑概念包含关系描述符;
ar(r)为NC中的概念A且满足
Figure BDA0002935726410000047
不存在A’使得
Figure BDA0002935726410000048
其中(range(r)表示关系r的值域;
关于
Figure BDA0002935726410000049
的MB定义为以下集合:
Figure BDA00029357264100000410
Figure BDA00029357264100000411
Figure BDA00029357264100000412
其中:
Figure BDA00029357264100000413
Figure BDA00029357264100000414
优选的,所述于步骤S2001包括如下步骤:
S1:将ρ(C)的计算结果存入集合LogicRelevant;
S2:将候选上界概念集合upperCandidates和候选下界概念集合lowerCandidates的初值都设为LogicRelevant;
S3:如果知识库中的最一般概念
Figure BDA00029357264100000415
不在upperCandidates中且upperCandidates中的元素个数大于1,则执行步骤S4,否则执行步骤S6;
S4:从候选的上界概念集合upperCandidates中选择概念Ci和Cj;利用概念空间上的偏序关系计算lgg(Ci,Cj),即Ci和Cj的最小上界,将lgg(Ci,Cj)的计算结果同时并入集合upperCandidates和集合LogicRelevant;
S5:将概念Ci和Cj从集合upperCandidates中删除,并回到步骤S3;
S6:如果知识库中最特殊的概念⊥不在lowerCandidates中且集合lowerCandidates中的元素个数大于1,则执行步骤S7,否则执行步骤S10;
S7:从集合lowerCandidates中选择概念Ci和Cj,利用概念空间上的偏序关系计算mgs(Ci,Cj),即Ci和Cj的最大下界,将mgs(Ci,Cj)的计算结果同时并入集合lowerCandidates和集合LogicRelevant;
S8:将Ci和Cj从集合lowerCandidates中删除,并回到步骤S6;
S9:上界概念upperConcept赋值为候选的上界概念集合upperCandidates中的最后一个元素,下界概念lowerConcept赋值为候选的下界概念集合lowerCandidates中的最后一个元素,集合LogicRelevant赋值为前述步骤S1的LogicRelevant、{upperConcept}和{lowerConcept}的并集;
S10:利用求精操作符ρ计算ρ(upperConcept),并将其计算结果并入集合LogicRelevant;
S11:对于LogicRelevant中的每一个概念Clog,在集合C中存在一个概念CE使得p(CE|Clog)≥t或者p(Clog|CE)≥t,则将Clog并入LogicRelevant以得到最终的LogicRelevant,并以此作为相关概念集合SC,其中t为设定的条件概率阈值,其中:
条件概率p(CE|Clog)的计算方式如下:在描述逻辑模型论语义的条件下,计算p(C)的值转化为描述逻辑知识库中的实例检测问题,即
Figure BDA0002935726410000051
满足概念C的实例数量与知识库中总实例,即个体总数的比值;其中,
Instance(C)表示知识库中概念C的实例个数,即使用概念C对资源进行语义描述的资源数量;假设概念C′和C在同一条求精链上且有
Figure BDA0002935726410000052
则p(C|C′)=1成立,因为C′和C之间具有确定的包含关系;因此条件概率
Figure BDA0002935726410000053
的计算可简化为
Figure BDA0002935726410000054
若概念C′和C不在同一条求精链上,可先根据概念空间中的偏序关系找到C′和c的最小上界Igg(C,C′),再计算p(lgg(C,C′)|C′);
S12:返回最终的相关概念集合SC
对于该实施例而言,其充分利用了现有的数学知识,将其创造性的用于音乐资源,进行数据处理,从而给出了本公开所述的相关概念集合SC的实施方式。能够理解,本公开的发明构思并不应当受限于具体的数据处理手段。
优选的,步骤S12之后还包括如下步骤:
S13、除了上界upperConcept和下界lowerConcept,所述计算过程中保留计算上界和下界过程中的中间结果,将其保存到集合StrucRelevant中,其中,集合StrucRelevant中的概念是与上界upperConcept和下界lowerConcept有直接包含关系的概念。
以此,本公开提出了一种基于描述逻辑知识库TBox逻辑结构的音乐资源组织和访问方式,通过定义满足偏序性质的TBox概念空间,建立有序的音乐资源集合,利用这种有序关系提供更加准确高效的音乐资源检索能力,弥补现有关键词检索文本信息系统的短板。
附图说明
图1为本公开一个实施例中所述方法的示意图;
图2为本公开一个实施例中所述关键步骤的示意图;
图3为本公开一个实施例中原子概念顺序关系示意图;
图4为本公开一个实施例中原子属性顺序关系示意图;
图5为本公开一个实施例中民间音乐资源有序概念空间结构说明图;
图6为本公开一个实施例中求精操作运算的示意图;
图7为本公开一个实施例中有序概念空间中相关性概念的示意图;
图8为本公开一个实施例中使用有序概念空间中的原子概念和复杂构造型概念对资源进行语义标注的示意图;
图9为本公开构造ABox过程的示意图。
具体实施方式
为了使本领域技术人员理解本公开所披露的技术方案,下面将结合实施例及有关附图1至图9,对各个实施例的技术方案进行描述,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。本公开所采用的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,“包括”和“具有”以及它们的任何变形,意图在于覆盖且不排他的包含。例如包含了一系列步骤或单元的过程、或方法、或系统、或产品或设备没有限定于已列出的步骤或单元,而是可选的还包括没有列出的步骤或单元,或可选的还包括对于这些过程、方法、系统、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本公开的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其他实施例互斥的独立的或备选的实施例。本领域技术人员可以理解的是,本文所描述的实施例可以与其他实施例相结合。
参见图1,在一个实施例中,本公开揭示了一种描述逻辑知识库上有序概念空间的音乐资源的检索方法,包括如下步骤:
S100、对于存储音乐资源的描述逻辑知识库,定义满足集合偏序性质的知识库上的有序概念空间,包括如下子步骤:
S1001、定义所述知识库的有序概念空间,其中,
所述有序概念空间包含:知识库中的所有原子概念和使用概念求精操作运算ρ(C)产生的合成概念;
其中,
将所述描述逻辑知识库中TBox定义的、不包含任何描述逻辑概念构造符的词汇记为原子词汇,并将原子词汇所描述的概念记为原子概念;
将所述描述逻辑知识库中合法的描述逻辑概念,和所述知识库所支持的描述逻辑概念构造符所产生的概念,记为合成概念;其中,
使用概念求精操作运算ρ(C)自动地产生合成概念,且求精操作可保持所产生的合成概念的顺序关系,即对于概念C’∈ρ(C),有
Figure BDA0002935726410000071
S1002、根据求精操作的性质,对知识库中的原子概念和利用求精操作运算生成的合成概念进行排序,以产生知识库上的概念空间的格结构,其中:每一对概念在概念空间中都可以找到他们的最小上界和最大下界;
其中,利用求精操作符的自反性和传递性定义概念空间上的偏序关系,以保证概念空间的有序性,使得对于任何一对概念C1和C2,都能够在概念空间上找到C1和C2的上界和下界;
S200、对所述概念空间中的每一个概念C,计算与其语义上相关概念集合SC,以使得所述知识库的ABox中每一个资源都使用相关概念集合SC上的一个概念进行了描述,具体包括如下子步骤:
S2001、利用所述偏序关系得到逻辑上语义相关的概念,以及同时属于不同概念的实例数量所蕴含的语义相关性,对每一个概念C分别计算其在逻辑上的相关概念集合CL和在实例数量上的相关概念集合CI,两者的交集CL∩CI则为与该概念C对应的相关概念集合SC;S300、将查询所述音乐资源的查询请求转化为:查询所述知识库有序概念空间上的查询请求概念CQ,具体包括:
对于以查询关键词方式提交的所述音乐资源的查询请求,在语法上将其和知识库有序概念空间中的概念名称进行字符串匹配,找到与所述查询关键词具有最大相似性的概念名称,将该概念作为查询请求概念CQ
S400、在所述步骤S200计算所得的相关概念集合SC中查找与查询请求概念CQ相关的概念集合SCQ,并从知识库ABox中查找使用SCQ中的概念描述的资源实例作为查询的结果。
本实施例通过基于描述逻辑知识库和有序概念空间这两种手段,对于音乐此种难以深度检索的艺术资源,将其转换为知识库上的概念的查找,从而有利于实现一种新的检索系统,实现对音乐资源的深入检索。
能够理解,在知识库ABox中,本实施例实现了每一个资源都使用知识库概念空间上相关概念集合SC中的一个概念进行了描述,因此,找到ABox中所有出现在SCQ中的概念所描述的资源,这些资源就是满足用户查询请求的资源。
具体而言,本公开的基本思路是:通过定义音乐资源知识库概念空间上的偏序结构,提出了基于有序概念建立音乐资源知识库的思想和有序资源空间上的相关资源的检索方法,该方法将建立基于有序描述逻辑的音乐资源知识库分为如下关键步骤:
(1)定义音乐领域中的核心词汇,构建知识库的Tbox;
(2)定义满足集合偏序性质的音乐概念空间,构造TBox上的有序关系;
(3)对概念空间中的每一个概念,计算与其语义上相关的一组概念;
(4)对于每一个音乐资源,使用一组相关资源对其进行语义标注,构建知识库的Abox。
当然,不言而喻的,出于知识库的必然要求,每一个步骤均要保证资源知识库上的实体以满足开放关联数据要求的形式描述。
在另一个实施例中,
关于有序概念空间中的每一个概念C的求精操作运算ρ(C)定义如下:
Figure BDA0002935726410000081
其含义是:对概念C进行求精操作ρ,如果C为所述知识库中的最一般概念
Figure BDA0002935726410000085
则ρ(C)的结果是
Figure BDA0002935726410000082
否则ρ(C)的结果为
Figure BDA0002935726410000083
其中,
Figure BDA0002935726410000084
的计算根据如下定义的ρB(C)的计算公式确定:
Figure BDA0002935726410000091
其中,ρB(C)上述公式中的:
A,C,Ci,D表示知识库的TBox中的概念,
NC表示知识库的TBox中概念的集合,
r,s表示知识库中描述音乐资源的属性的定义彼此之间的关系,
NR表示所述关系的集合,
Figure BDA0002935726410000095
Figure BDA0002935726410000097
为知识库上使用的标准的描述逻辑知识库概念构造运算符,
ρB(C)中出现的操作的含义定义如下:
Figure BDA0002935726410000092
其中A”就是一个符号,区分A,A’,A”是不同的概念,这是标准的集合操作上的约束的表示,本身具有清楚明确的含义;
Figure BDA0002935726410000093
用于强调作用在有序概念空间上包含关系;
Figure BDA0002935726410000094
Figure BDA0002935726410000101
Figure BDA0002935726410000102
ad(r)为NC中的概念A且满足
Figure BDA0002935726410000103
不存在A’使得
Figure BDA0002935726410000104
其中(domain(r)表示关系r的定义域);
Figure BDA0002935726410000105
Figure BDA0002935726410000106
均是标准的描述逻辑概念包含关系描述符;
ar(r)为NC中的概念A且满足
Figure BDA0002935726410000107
不存在A’使得
Figure BDA0002935726410000108
其中(range(r)表示关系r的值域;
关于
Figure BDA0002935726410000109
的MB定义为以下集合:
Figure BDA00029357264100001010
Figure BDA00029357264100001011
Figure BDA00029357264100001012
其中:
Figure BDA00029357264100001013
Figure BDA00029357264100001014
对于上述实施例,其充分利用了知识库和逻辑概念以及标准集合操作,将其创新性的用于音乐资源的检索。
在另一个实施例中,所述子步骤S2001包括如下步骤:
S1:将ρ(C)的计算结果存入集合LogicRelevant;
S2:将候选上界概念集合upperCandidates和候选下界概念集合lowerCandidates的初值都设为LogicRelevant;
S3:如果知识库中的最一般概念
Figure BDA00029357264100001015
不在upperCandidates中且upperCandidates中的元素个数大于1,则执行步骤S4,否则执行步骤S6;
S4:从候选的上界概念集合upperCandidates中选择概念Ci和Cj;利用概念空间上的偏序关系计算lgg(Ci,Cj),即Ci和Cj的最小上界,将lgg(Ci,Cj)的计算结果同时并入集合upperCandidates和集合LogicRelevant;
S5:将概念Ci和Cj从集合upperCandidates中删除,并回到步骤S3;
S6:如果知识库中最特殊的概念⊥不在lowerCandidates中且集合lowerCandidates中的元素个数大于1,则执行步骤S7,否则执行步骤S10;
S7:从集合lowerCandidates中选择概念Ci和Cj,利用概念空间上的偏序关系计算mgs(Ci,Cj),即Ci和Cj的最大下界,将mgs(Ci,Cj)的计算结果同时并入集合lowerCandidates和集合LogicRelevant;
S8:将Ci和Cj从集合lowerCandidates中删除,并回到步骤s6;
S9:上界概念upperConcept赋值为候选的上界概念集合upperCandidates中的最后一个元素,下界概念lowerConcept赋值为候选的下界概念集合lowerCandidates中的最后一个元素,集合LogicRelevant赋值为前述步骤S1的LogicRelevant、{upperConcept}和{lowerConcept}的并集;
S10:利用求精操作符ρ计算ρ(upperConcept),并将其计算结果并入集合LogicRelevant;
S11:对于LogicRelevant中的每一个概念Clog,在集合C中存在一个概念CE使得p(CE|Clog)≥t或者p(Clog|CE)≥t,则将Clog并入LogicRelevant以得到最终LogicRelevant,并以此作为相关概念集合SC,其中t为设定的条件概率阈值,其中:
条件概率p(CE|Clog)的计算方式如下:在描述逻辑模型论语义的条件下,计算p(C)的值转化为描述逻辑知识库中的实例检测问题,即
Figure BDA0002935726410000111
满足概念C的实例数量与知识库中总实例,即个体总数的比值;其中,
Instance(C)表示知识库中概念C的实例个数,即使用概念C对资源进行语义描述的资源数量;假设概念C′和C在同一条求精链上且有
Figure BDA0002935726410000112
则p(C|C′)=1成立,因为C′和C之间具有确定的包含关系;因此条件概率
Figure BDA0002935726410000113
的计算可简化为
Figure BDA0002935726410000114
若概念C′和C不在同一条求精链上,可先根据概念空间中的偏序关系找到C′和C的最小上界Igg(C,C′),再计算p(lgg(C,C′)|C′).
S12:返回最终的相关概念集合SC
对于该实施例而言,其充分利用了现有的数学知识,将其创造性的用于音乐资源,进行数据处理,从而给出了本公开所述的相关概念集合SC的实施方式。能够理解,本公开的发明构思并不应当受限于具体的数据处理手段。
进一步的,对集合LogicRelevant进行扩展,使其包含:在知识库中从语义层面与样本高度相关的概念。由于求精操作在其操作过程中,是给对应的初始概念上添加新的概念和关系,所以扩展方法是对以上界upperConcept为初始概念进行求精操作,从得到的结果中进一步选择语义相关的概念,并对每一个逻辑上相关的概念使用条件概率阈值t进行筛选,获得最终的相关概念集合Sc。
在另一个实施例中,步骤S12之后还包括如下步骤:
S13、除了上界upperConcept和下界lowerConcept,所述计算过程中保留计算上界和下界过程中的中间结果,将其保存到集合StrucRelevant中,其中,集合StrucRelevant中的概念是与上界upperConcept和下界IowerConcept有直接包含关系的概念。
能够理解,中间结果不仅可以用于此类音乐资源的检索,而且可以通过中间结果不断优化本检索方法及其系统。根源在于:中间结果所对应的集合中的元素,反映了与上界和下界集合中某些概念的包含关系,这完全可以用于信息的检索。
正是在前述实施例的的基础上,本公开与现有技术相比,具有以下优点:
第一,由于本公开考虑到了领域概念集合上的顺序,构造了一个易于理解且易于实现的领域概念空间,因此将领域中的资源也有序地组织了起来,更加有利于资源集合的浏览和可视化。无论是人还是机器都可以方便地全面浏览知识库上的资源,确定与需求相关的资源子集。
第二,由于本公开考虑了有序领域概念空间上包含的所有类型概念,包括原子概念以及使用描述逻辑构造符生成的复杂概念,因此用于标注资源的概念既有原子概念,也有复杂概念,实现了对资源的精确标注,知识库中对于个体资源的描述就更加准确丰富,对于复杂的查询条件,精确的标注可以提供更加准确的资源检索服务;
第三,由于本公开考虑了基于领域概念空间逻辑结构的概念相关性,提出了计算概念空间上一组相关性概念的方法,并将此方法用于资源检索过程,因此可以有效提高资源检索结果的正确率和召回率。
以下,以中国民间音乐为例,参见图2,在另一个实施例中,本公开给出前述关键几个步骤的更加具体、细化的实施例:
步骤一:定义民间音乐领域中的核心词汇,构造TBox;
中国民间音乐知识库中的词汇来源于两种:音乐本体MusicOntology中关于音乐的一般概念和属性的描述(例如借鉴http://musicontology.com/specification/中Summary of Terms,Classed,Properties,Individua1s中所列出的词汇);以及针对中国民间音乐特征的概念和属性,这部分词汇可以来源于人工的标注。
步骤二:定义满足集合偏序性质的民间音乐概念空间;
首先定义中国民间音乐知识库上的有序概念:
定义1(有序概念)知识库
Figure BDA0002935726410000131
上的一个有序概念
Figure BDA0002935726410000132
是一个概念序列C1,C2,...Cn并记为
Figure BDA0002935726410000133
Ci(1≤i≤n)具有以下形式之一:(1)Ci=A;
Figure BDA0002935726410000134
Figure BDA0002935726410000135
其中A,E,
Figure BDA0002935726410000136
Figure BDA0002935726410000137
中的原子概念或者是满足定义1的描述逻辑概念,r是
Figure BDA0002935726410000138
上的关系;操作符
Figure BDA0002935726410000139
表示生成概念
Figure BDA00029357264100001310
的描述逻辑构造符.由C1,C2,...,Cn构成的但不考虑其出现次序的概念记为C;
有序概念包括原子概念和通过描述逻辑构造符生成的复杂构造概念。关于构造概念的生成的相关概念定义如下:
定义2(求精操作符)拟序描述了一种具有自反性和传递性的关系
在一个拟序空间
Figure BDA00029357264100001311
中一个向下求精操作(downward refinement operator)符ρ是一个从S到2S的映射,对于所有C∈S有C′∈ρ(C)蕴含着C≤C(或C≥C′).C′称为对C的特化。
同理可以定义向上求精操作符;
定义3(
Figure BDA00029357264100001314
求精操作符)设
Figure BDA00029357264100001315
为描述逻辑语言.在拟序空间
Figure BDA00029357264100001316
上的一个求精操作符称为一个
Figure BDA00029357264100001317
求精操作符;
定义4(求精链)关于
Figure BDA00029357264100001318
求精操作符ρ的一个长度为n的从概念C到概念D的求精链是一个有限的概念序列C0,C1,...,Cn,C=C0,C1∈ρ(C0),C2∈ρ(C1),...,Cn∈ρ(Cn-1),D=Cn.求精链经过概念E当且仅当存在i(1≤i≤n)满足E=Ci.如果存在一条从概念C到D的求精链,则称从概念C通过ρ可到达D.ρ*(C)表示从C开始通过ρ可到达的所有概念.ρm(C)表示从C开始通过长度为m的ρ的求精链可到达的所有概念;
在本公开中,将复杂的构造型概念定义为从知识库上的原子概念C开始利用合法的求精操作符所产生的求精链上的所有概念。本公开所使用的关于概念C的求精操作运算ρB(C)定义如下:
Figure BDA0002935726410000141
Figure BDA0002935726410000142
Figure BDA0002935726410000143
Figure BDA0002935726410000144
Figure BDA0002935726410000145
Figure BDA0002935726410000146
Figure BDA0002935726410000151
Figure BDA0002935726410000152
Figure BDA0002935726410000153
关于
Figure BDA0002935726410000154
的MB定义为以下集合:
Figure BDA0002935726410000155
Figure BDA0002935726410000156
Figure BDA0002935726410000157
Figure BDA0002935726410000158
步骤三:对概念空间中的每一个概念,计算与其语义上相关的一组概念;
在知识库上,与某一概念在语义上相关的一组概念可以通过如下算法得到:
算法1:搜索逻辑结构上的相关概念
1.输入:描述逻辑知识库K,样本概念C;
2.输出:上界概念upperConcept,下界概念lowerConcept,结构相关概念集合StrucRelevant;
3.
Figure BDA0002935726410000159
4.upperCandidates=C;
5.lowerCandidates=C;
6.while(
Figure BDA00029357264100001510
is not in upperCandidates and|upperCandidates|>1)
7.从upperCandidates中选择概念Ci和Cj;
8.upperCandidates=upperCandidates∪lgg(Ci,Cj);
9.StrucRelevant=StrucRelevant∪lgg(Ci,Cj);
10.remove Ci,Cjfrom upperCandidates;
11.endwhile
12.while(⊥is not in lowerCandidates and|lowerCandidates|>1)
13.从lowerCandidates中选择概念Ci和Cj
14.lowerCandidates=lowerCandidates∪mgs(Ci,Cj);
15.StrucRelevant=StrucRelevant∪lgg(Ci,Cj);
16.remove Ci,Cj from lowerCandidates;
17.endwhile
18.upperConcept=upperCandidates中的最后一个元素;
19.lowerConcept=lowerCandidates中的最后一个元素;
20.StrucRelevant=StrucRelevant∪{upperConcept}∪{lowerConcept};
21.return upperConcept,lowerConcept,StrucRelevant;
在算法1中,除了关于正样本的上界upperConcept和下界lowerConcept,计算过程中保留计算上界和下界过程中的中间结果,将其保存到集合StrucRelevant中.StrucRelevant中的概念比upperConcept更特殊,比lowerConcept更一般,是与upperConcept和lowerConcept有直接包含关系的概念,所以确定其为相关概念。
进一步,在算法1的基础上,对StrucRelevant进行扩展,使其包含在知识库中从语义层面与样本高度相关的概念。由于求精操作可以在其操作对应的初始概念上添加新的概念和关系,所以扩展方法是对以upperConcept为初始概念进行求精操作,从得到的结果中进一步选择语义相关的概念.同时对每一个逻辑结构上相关的概念使用条件概率阈值进行筛选,获得最终的相关概念集合。这一过程如算法2所示:
算法2相关概念的选择
input:来自算法1的upperConcept,lowerConcept,StrucRelevant;
output:相关概念集合RelevantConcept
1.
Figure BDA0002935726410000161
2.refinements=refine(upperConcept);//对upperConcept进行求精操作,以发现与样本语义上相容的概念描述
3.StrucRelevant=StrucRelevant∪refinements
4.for each concept Cstru in StrucRelevant
5.for each concept CEthat cover a positive example
6.if(p(CE|Cstru)≥t or p(Cstru|CE)≥t)
7.RelevantConcept=RelevantConcept∪{Cstru};
8.return RelevantConcept;
对于概念
Figure BDA0002935726410000171
和C,两者具有相同的实例集合,将直接使用p(C)来表达概念对应的量化值.在描述逻辑模型论语义的环境下,计算p(C)的值可以转化为描述逻辑知识库中的实例检测问题,即
Figure BDA0002935726410000172
满足概念C的实例数量与知识库中总实例(个体总数)的比值.假设概念C′和C在同一条求精链上且有
Figure BDA0002935726410000173
则p(C|C′)=1成立,因为C′和C之间具有确定的包含关系.因此条件概率
Figure BDA0002935726410000174
的计算可简化为
Figure BDA0002935726410000175
对于概念搜索空间上的有序概念,
Figure BDA0002935726410000176
对于属于同一条求精链上的搜索空间上的有序概念
Figure BDA0002935726410000177
Figure BDA0002935726410000178
Figure BDA0002935726410000179
步骤四:对于每一个音乐资源,使用一组相关资源对其进行语义标注,构造民间音乐资源知识库库的ABox;
资源的语义标注是一个结合了人工标注和自动标注的混合式的标注过程。对于人工提供了语义标签的资源,将标签理解为知识库中的概念,利用算法1和算法2,找出与该资源相关的一组概念,做为其语义描述;对于没有人工标签的资源,根据资源的名称,通过百度百科、维基百科和搜索引擎获取资源的描述信息,从描述信息中查找与概念空间中的概念相匹配的描述,如果存在这样的描述,则使用相应匹配的概念对该资源进行语义描述。
本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作、步骤,乃至其对应的模块、单元并不一定是本公开所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本公开所提供的几个实施例中,应该理解到,所揭露的方法,可实现为对应的功能单元、处理器乃至系统,其中所述系统的各部分既可以位于一个地方,也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。另外,各功能单元可以集成在一个处理单元中,也可以是各个单元单独存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为智能手机、个人数字助理、可穿戴设备、笔记本电脑、平板电脑)执行本公开的各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开的各实施例技术方案的范围。

Claims (4)

1.基于描述逻辑知识库上有序概念空间的音乐资源的检索方法,包括如下步骤:
S100、对于存储音乐资源的描述逻辑知识库,定义满足集合偏序性质的知识库上的有序概念空间,包括如下子步骤:
S1001、定义所述知识库的有序概念空间,其中,
所述有序概念空间包含:知识库中的所有原子概念和使用概念求精操作运算ρ(C)产生的合成概念;
其中,
将所述描述逻辑知识库中TBox定义的、不包含任何描述逻辑概念构造符的词汇记为原子词汇,并将原子词汇所描述的概念记为原子概念;
将所述描述逻辑知识库中合法的描述逻辑概念,和所述知识库所支持的描述逻辑概念构造符所产生的概念,记为合成概念;其中,
使用概念求精操作运算ρ(C)自动地产生合成概念,且求精操作可保持所产生的合成概念的顺序关系,即对于概念C’∈ρ(C),有
Figure FDA0002935726400000011
S1002、根据求精操作的性质,对知识库中的原子概念和利用求精操作运算生成的合成概念进行排序,以产生知识库上的概念空间的格结构,其中:每一对概念在概念空间中都可以找到他们的最小上界和最大下界;
其中,利用求精操作符的自反性和传递性定义概念空间上的偏序关系,以保证概念空间的有序性,使得对于任何一对概念C1和C2,都能够在概念空间上找到C1和C2的上界和下界;
S200、对所述概念空间中的每一个概念C,计算与其语义上相关概念集合SC,以使得所述知识库的ABox中每一个资源都使用相关概念集合SC上的一个概念进行了描述,具体包括如下子步骤:
S2001、利用所述偏序关系得到逻辑上语义相关的概念,以及同时属于不同概念的实例数量所蕴含的语义相关性,对每一个概念C分别计算其在逻辑上的相关概念集合CL和在实例数量上的相关概念集合CI,两者的交集CL∩CI则为与该概念C对应的相关概念集合SC;S300、将查询所述音乐资源的查询请求转化为:查询所述知识库有序概念空间上的查询请求概念CQ,具体包括:
对于以查询关键词方式提交的所述音乐资源的查询请求,在语法上将其和知识库有序概念空间中的概念名称进行字符串匹配,找到与所述查询关键词具有最大相似性的概念名称,将该概念作为查询请求概念CQ
S400、在所述步骤S200计算所得的相关概念集合SC中查找与查询请求概念CQ相关的概念集合SCQ,并从知识库ABox中查找使用SCQ中的概念描述的资源实例作为查询的结果;
这是因为:在知识库ABox中,每一个资源都使用知识库概念空间上相关概念集合SC中的一个概念进行了描述,因此,找到ABox中所有出现在SCQ中的概念所描述的资源,这些资源就是满足用户查询请求的资源。
2.根据权利要求1所述的方法,其中,优选的,
关于有序概念空间中的每一个概念C的求精操作运算ρ(C)定义如下:
Figure FDA0002935726400000021
其含义是:对概念C进行求精操作p,如果C为所述知识库中的最一般概念
Figure FDA0002935726400000022
则ρ(C)的结果是
Figure FDA0002935726400000023
否则ρ(C)的结果为
Figure FDA0002935726400000024
其中,
Figure FDA0002935726400000025
的计算根据如下定义的ρB(C)的计算公式确定:
Figure FDA0002935726400000031
其中,ρB(C)上述公式中的:
A,C,Ci,D表示知识库的TBox中的概念,
NC表示知识库的TBox中概念的集合,
r,s表示知识库中描述音乐资源的属性的定义彼此之间的关系,
NR表示所述关系的集合,
Figure FDA0002935726400000037
Figure FDA0002935726400000034
为知识库上使用的标准的描述逻辑知识库概念构造运算符,
ρB(C)中出现的操作的含义定义如下:
Figure FDA0002935726400000035
其中A”就是一个符号,区分A,A’,A”是不同的概念,这是标准的集合操作上的约束的表示,本身具有清楚明确的含义;
Figure FDA0002935726400000036
用于强调作用在有序概念空间上包含关系;
Figure FDA0002935726400000041
Figure FDA0002935726400000042
Figure FDA0002935726400000043
ad(r)为NC中的概念A且满足
Figure FDA0002935726400000044
不存在A’使得
Figure FDA0002935726400000045
Figure FDA0002935726400000046
其中(domain(r)表示关系r的定义域);
Figure FDA0002935726400000047
Figure FDA0002935726400000048
均是标准的描述逻辑概念包含关系描述符;
ar(r)为NC中的概念A且满足
Figure FDA0002935726400000049
不存在A’使得
Figure FDA00029357264000000410
其中(range(r)表示关系r的值域;
关于
Figure FDA00029357264000000414
的MB定义为以下集合:
Figure FDA00029357264000000411
Figure FDA00029357264000000412
其中:
Figure FDA00029357264000000413
Figure FDA00029357264000000416
3.根据权利要求1所述的方法,其特征在于,所述子步骤S2001包括如下步骤:
S1:将ρ(C)的计算结果存入集合LogicRelevant
S2:将候选上界概念集合upperCandidates和候选下界概念集合lowerCandidates的初值都设为LogicRelevant;
S3:如果知识库中的最一般概念
Figure FDA00029357264000000415
不在upperCandidates中且upperCandidates中的元素个数大于1,则执行步骤S4,否则执行步骤S6;
S4:从候选的上界概念集合upperCandidates中选择概念Ci和Cj;利用概念空间上的偏序关系计算lgg(Ci,Cj),即Ci和Cj的最小上界,将lgg(Ci,Cj)的计算结果同时并入集合upperCandidates和集合LogicRelevant;
s5:将概念Ci和Cj从集合upperCandidates中删除,并回到步骤S3;
S6:如果知识库中最特殊的概念⊥不在lowerCandidates中且集合lowerCandidates中的元素个数大于1,则执行步骤S7,否则执行步骤S10;
S7:从集合lowerCandidates中选择概念Ci和Cj,利用概念空间上的偏序关系计算mgs(Ci,Cj),即Ci和Cj的最大下界,将mgs(Ci,Cj)的计算结果同时并入集合lowerCandidates和集合LogicRelevant;
S8:将Ci和Cj从集合lowerCandidates中删除,并回到步骤S6;
S9:上界概念upperConcept赋值为候选的上界概念集合upperCandidates中的最后一个元素,下界概念lowerConcept赋值为候选的下界概念集合lowerCandidates中的最后一个元素,集合LogicRelevant赋值为前述步骤S1的LogicRelevant、{upperConcept}和{lowerConcept}的并集;
S10:利用求精操作符ρ计算ρ(upperConcept),并将其计算结果并入集合LogicRelevant;
S11:对于LogicRelevant中的每一个概念Clog,在集合C中存在一个概念CE使得p(CE|Clog)≥t或者p(Clog|CE)≥t,则将Clog并入LogicRelevant以得到最终的LogicRelevant,并以此作为相关概念集合SC,其中t为设定的条件概率阈值,其中:
条件概率p(CE|Clog)的计算方式如下:在描述逻辑模型论语义的条件下,计算p(C)的值转化为描述逻辑知识库中的实例检测问题,即
Figure FDA0002935726400000051
满足概念C的实例数量与知识库中总实例,即个体总数的比值;其中,
Instance(C)表示知识库中概念C的实例个数,即使用概念C对资源进行语义描述的资源数量;假设概念C′和C在同一条求精链上且有
Figure FDA0002935726400000054
则p(C|C′)=1成立,因为C′和C之间具有确定的包含关系;因此条件概率
Figure FDA0002935726400000052
的计算可简化为
Figure FDA0002935726400000053
若概念C′和C不在同一条求精链上,可先根据概念空间中的偏序关系找到C′和C的最小上界lgg(C,C′),再计算p(lgg(C,C′)C′).
S12:返回最终的相关概念集合SC
4.根据权利要求3所述的方法,其特征在于,步骤S12之后还包括如下步骤:
S13、除了上界upperConcept和下界lowerConcept,所述计算过程中保留计算上界和下界过程中的中间结果,将其保存到集合StrucRelevant中,其中,集合StrucRelevant中的概念是与上界upperConcept和下界lowerConcept有直接包含关系的概念。
CN202110165946.3A 2021-02-05 2021-02-05 基于描述逻辑知识库上有序概念空间的音乐资源检索方法 Active CN112860940B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110165946.3A CN112860940B (zh) 2021-02-05 2021-02-05 基于描述逻辑知识库上有序概念空间的音乐资源检索方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110165946.3A CN112860940B (zh) 2021-02-05 2021-02-05 基于描述逻辑知识库上有序概念空间的音乐资源检索方法

Publications (2)

Publication Number Publication Date
CN112860940A true CN112860940A (zh) 2021-05-28
CN112860940B CN112860940B (zh) 2022-11-25

Family

ID=75988799

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110165946.3A Active CN112860940B (zh) 2021-02-05 2021-02-05 基于描述逻辑知识库上有序概念空间的音乐资源检索方法

Country Status (1)

Country Link
CN (1) CN112860940B (zh)

Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2865055A1 (fr) * 2004-01-12 2005-07-15 Thomson Licensing Sa Base de connaissance ontologique et procede d'extraction d'informations a partir d'une requete en langage naturel.
US20070078889A1 (en) * 2005-10-04 2007-04-05 Hoskinson Ronald A Method and system for automated knowledge extraction and organization
CN101566988A (zh) * 2008-04-24 2009-10-28 华为技术有限公司 一种模糊语义搜索方法、系统及设备
CN101706792A (zh) * 2009-11-27 2010-05-12 河南大学 一种面向中文查询句的三级查询目标分析方法
US7827125B1 (en) * 2006-06-01 2010-11-02 Trovix, Inc. Learning based on feedback for contextual personalized information retrieval
CN103049555A (zh) * 2012-12-30 2013-04-17 中国人民解放军国防科学技术大学 保证语义正确性的动态分层集成数据访问方法
KR20130064226A (ko) * 2011-12-08 2013-06-18 숭실대학교산학협력단 시맨틱 웹에서 관계형 데이터베이스를 owl 온톨로지로 사용하기 위한 질의처리장치 및 방법
US20160004965A1 (en) * 2014-07-07 2016-01-07 derivo GmbH Abstraction refinement for scalable type reasoning in ontology-based data repositories
CN106815279A (zh) * 2016-09-30 2017-06-09 京华信息科技股份有限公司 基于本体的政务知识检索系统
CN109087223A (zh) * 2018-08-03 2018-12-25 广州大学 一种基于本体的教育资源模型构建方法

Patent Citations (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2865055A1 (fr) * 2004-01-12 2005-07-15 Thomson Licensing Sa Base de connaissance ontologique et procede d'extraction d'informations a partir d'une requete en langage naturel.
US20070078889A1 (en) * 2005-10-04 2007-04-05 Hoskinson Ronald A Method and system for automated knowledge extraction and organization
US7827125B1 (en) * 2006-06-01 2010-11-02 Trovix, Inc. Learning based on feedback for contextual personalized information retrieval
CN101566988A (zh) * 2008-04-24 2009-10-28 华为技术有限公司 一种模糊语义搜索方法、系统及设备
CN101706792A (zh) * 2009-11-27 2010-05-12 河南大学 一种面向中文查询句的三级查询目标分析方法
KR20130064226A (ko) * 2011-12-08 2013-06-18 숭실대학교산학협력단 시맨틱 웹에서 관계형 데이터베이스를 owl 온톨로지로 사용하기 위한 질의처리장치 및 방법
CN103049555A (zh) * 2012-12-30 2013-04-17 中国人民解放军国防科学技术大学 保证语义正确性的动态分层集成数据访问方法
US20160004965A1 (en) * 2014-07-07 2016-01-07 derivo GmbH Abstraction refinement for scalable type reasoning in ontology-based data repositories
CN106815279A (zh) * 2016-09-30 2017-06-09 京华信息科技股份有限公司 基于本体的政务知识检索系统
CN109087223A (zh) * 2018-08-03 2018-12-25 广州大学 一种基于本体的教育资源模型构建方法

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
HONGCAN YAN ETC.: "Knowledge reasoning and Tableau Algorithm improving based on rough description logics", 《2012 9TH INTERNATIONAL CONFERENCE ON FUZZY SYSTEMS AND KNOWLEDGE DISCOVERY》 *
初林洁: "基于本体和描述逻辑的SWRL推理研究", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *
王军等: "基于描述逻辑的概念图推理", 《计算机科学》 *
王耀辉: "融合规则推理的工程知识图语义查询", 《中国优秀硕士学位论文全文数据库(信息科技辑)》 *

Also Published As

Publication number Publication date
CN112860940B (zh) 2022-11-25

Similar Documents

Publication Publication Date Title
US11593438B2 (en) Generating theme-based folders by clustering digital images in a semantic space
US10599643B2 (en) Template-driven structured query generation
US9600533B2 (en) Matching and recommending relevant videos and media to individual search engine results
US20180032606A1 (en) Recommending topic clusters for unstructured text documents
US9659084B1 (en) System, methods, and user interface for presenting information from unstructured data
JP5423030B2 (ja) ワードセットに関係するワードの決定
US9665643B2 (en) Knowledge-based entity detection and disambiguation
US10387469B1 (en) System and methods for discovering, presenting, and accessing information in a collection of text contents
JP7252914B2 (ja) 検索提案を提供する方法、装置、機器及び媒体
US20170212899A1 (en) Method for searching related entities through entity co-occurrence
WO2014054052A2 (en) Context based co-operative learning system and method for representing thematic relationships
KR101502671B1 (ko) 상관된 정보의 온라인 분석 및 디스플레이
US20140201203A1 (en) System, method and device for providing an automated electronic researcher
Vysotska et al. Method of similar textual content selection based on thematic information retrieval
CN111061828B (zh) 一种数字图书馆知识检索方法及装置
CN113190687B (zh) 知识图谱的确定方法、装置、计算机设备及存储介质
US20120317125A1 (en) Method and apparatus for identifier retrieval
KR101441219B1 (ko) 정보 엔터티들의 자동 연관
CN115563313A (zh) 基于知识图谱的文献书籍语义检索系统
CN111753167A (zh) 搜索处理方法、装置、计算机设备和介质
TW202001621A (zh) 語料庫產生方法及裝置、人機互動處理方法及裝置
JP2001290843A (ja) 文書検索装置及びその方法並びに文書検索プログラム及びそのプログラムを記録した記録媒体
Kambau et al. Concept-based multimedia information retrieval system using ontology search in cultural heritage
TWI290687B (en) System and method for search information based on classifications of synonymous words
WO2016009321A1 (en) System for searching, recommending, and exploring documents through conceptual associations and inverted table for storing and querying conceptual indices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant