CN107491479A - 一种基于本体库的标签管理方法 - Google Patents
一种基于本体库的标签管理方法 Download PDFInfo
- Publication number
- CN107491479A CN107491479A CN201710539796.1A CN201710539796A CN107491479A CN 107491479 A CN107491479 A CN 107491479A CN 201710539796 A CN201710539796 A CN 201710539796A CN 107491479 A CN107491479 A CN 107491479A
- Authority
- CN
- China
- Prior art keywords
- label
- user
- library
- tag
- ontology
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007726 management method Methods 0.000 title claims abstract description 67
- 238000004364 calculation method Methods 0.000 claims abstract description 13
- 238000012545 processing Methods 0.000 claims abstract description 8
- 238000011524 similarity measure Methods 0.000 claims abstract description 7
- 238000005259 measurement Methods 0.000 claims description 18
- 238000000034 method Methods 0.000 claims description 18
- 238000000605 extraction Methods 0.000 claims description 5
- 238000000205 computational method Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 claims description 3
- 239000000284 extract Substances 0.000 claims description 3
- 238000012795 verification Methods 0.000 claims description 3
- 230000008859 change Effects 0.000 claims description 2
- 238000005457 optimization Methods 0.000 abstract 1
- 230000008569 process Effects 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- 230000032683 aging Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000019771 cognition Effects 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000004438 eyesight Effects 0.000 description 1
- 230000006870 function Effects 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 230000007246 mechanism Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 230000001960 triggered effect Effects 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/3332—Query translation
- G06F16/3334—Selection or weighting of terms from queries, including natural language queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/48—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Multimedia (AREA)
- Library & Information Science (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产标注,并基于本体推理规则实现语义标签管理。用户通过管理端上传图片到图片数据库后,通过基于本体的多层语义标签库生成模块对图片处理,得到多层语义标签并存储到本体标签库中;通过基于本体推理规则的标签库生成模块对用户提交新标签进行处理。先将新标签加入现有标签库内容中,得到混合标签库;然后根据推理规则,处理混合标签库,得到最优化本体;最后,保存最优化本体并更新本体库。用户使用时提交查询信息到标签库中查询,若命中,则将标签查询结果返回用户;否则,则将查询信息通过相似度计算模块进行相似度计算后,得到查询信息相关推荐信息并返回给用户。
Description
技术领域
本发明涉及媒体资产管理领域,具体涉及一种基于本体库的标签管理方法。
背景技术
大数据时代的来临的一个表现就是以文本、图片、音频、视频为代表的数字媒体资产在数据量和内容多样性呈现暴增,同时人们对数字媒体资产的认知度和使用率也越来越频繁,数字媒体资产以多种应用形式广泛应用于公众及各个行业领域,尤其表现在媒体资产管理方面。
目前,在数字媒体资产管理相关应用行业,现有的管理方法需要依赖媒体资源附加的标签信息来为用户提供检索服务,均采用了基于文本的标签或者基于内容的标签管理的方法。基于文本的标签管理方法是基于关键词的匹配查找过程,它是在对文本、图像、音视频等进行文本标注的基础上,进行文本、图像特征抽取,建立索引数据库,再进行基于关键字的检索与管理。基于内容的标签管理方法是直接从图像、视频中提取客观的视觉特征(如颜色、纹理、形状等),通过匹配图像、视频帧之间的视觉特征来进行检索和管理。
上述现有技术提供的标签管理的方法存在明显的缺陷。
现有技术是一种基于文本或内容的标签管理的方法。但是,在实际中,基于内容生成的标签因为低层视觉特征与高层语义概念之间存在“语义鸿沟”,并且当融合多种视觉特征时,图像表示所需要的数据的维度通常很大,由此引发的“维度灾难”问题。基于文本的标签管理,由于不依靠内容,提取的标签可能与文本、图像、音视频所表达的内容并不相关,从而严重影响了现有标签管理方法的性能。而且,现在媒体资产数量呈现出几何数级的增长,这也使得人工基于文本标注变得费时费力。
现有一部分标签管理方法基本是靠管理端手动进行管理,需要人为修改标签内容,以及对不必要的标签进行手动剔除,巨大的标签数目让管理变得耗时耗力;还有一部分标签管理方法是开放权限允许用户进行输入,由于用户的知识水平差异,导致具有同种含义的标签数目产生巨大增长,并且,用户对事物的描述与理解能力的不同,使得大量无意义标签存在。因此,为了有效地提高图像检索方法的性能,如何高效、准确地进行自动图像语义标注,近年来己经成为学术界和工业界共同关注的热点研究问题。
本发明应用本体工具管理图片,利用本体可以帮助计算机从多种角度分析数字媒体的语义信息。传统标签管理只是标签的简单模式匹配,而没有能够关注标签的语义概念本身及其相关关系。而利用本体来刻画不同语言中对应的领域知识,以解决从查询标签到检索标签之间转换过程中出现的语义损失和曲解等问题,从而保证在管理过程中能够有效地遵循管理端的意图,获得预期的管理效果。
发明内容
本发明的目的是针对上述问题,提供一种用于媒体资产管理的基于本体库的标签管理方法。
本发明的目的可以通过以下技术方案来实现:
一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产进行标注,基于本体推理规则对语义标签动态更新,并基于本体库的标签搜索方法有利于提升媒体资产的管理效率。
所述多层语义标签提取具体为:
A1)用户通过管理端提交图片数据库到多层语义标签库模块;
A2)多层语义标签库模块对管理端提交的图片数据库进行处理,得到基于本体的多层语义标签数据库,并输入到本体标签库中;
所述基于本体推理规则具体为:
B1)用户通过管理端提交标签数据库到基于本体推理规则的标签库生成模块;
B2)基于本体推理规则的标签库生成模块获取本体标签库中内容,并将管理端输入的标签数据库与所获取的本体标签库中内容进行组合,得到混合的标签库;
B3)用户通过管理端建立本体规则库,随后基于本体推理规则的标签库生成模块结合规则库对混合标签库进行基于规则的推理、创建新的关联关系、淘汰掉冗余标签,得到最优化标签树;
B4)基于本体推理规则的标签库生成模块向本体标签库发送最优化标签树,并更新本体标签库中内容;
所述基于本体库的标签搜索方法具体为:
C1)用户提交需要查询的用户自定义标签;
C2)对用户自定义标签在本体标签库中进行查找,并将查找结果返回给用户。
所述步骤A1)具体包含:
A11)用户上传图片到图片数据库中;
A12)用户通过管理端对所有上传的图片进行审核,判断是否符合上传条件:
若是,则管理端提交图片到多层语义标签库模块;若否,则作审核不通过处理。
所述步骤B1)具体包含:
B11)用户上传标签到标签数据库中;
B12)具有审核权限的用户通过管理端对上传的标签进行审核,判断是否符合上传条件:
若是,则管理端提交标签到标签库;若否,则作审核不通过处理;
B13)标签数据库将标签提交到基于本体推理规则的标签库生成模块。
所述步骤B3)具体包含:
B31)基于本体推理规则的标签库生成模块获取标签的相似度计算信息,为新加入标签创建与现有本体中标签结点的关联关系,得到新本体标签树;
B32)用户创建本体规则库,并将规则库与推理工具绑定;
B33)根据推理规则和标签树调整算法,推理机对标签树结点位置进行调整,删除无用结点,得到最优化标签树。
所述步骤B31)具体包含:
B311)基于本体的多层次语义标签生成模块获取标签并输入本体标签库中,由基于本体推理规则的标签库生成模块创建标签的关联关系;
B312)手工调整,得到高可信度的本体标签关系,输入自建语料库保存。
所述步骤C1)具体包含:
C11)将用户提交查询的自定义标签保存为查询记录,基于本体推理规则的标签生成模块将根据查询记录进行本体库中标签权重调整;
C12)将用户提交查询的自定义标签转化为本体标签库标签查询语言,并提交到本体标签库中查询。
所述步骤C2)具体包含:
C21)在本体标签库中寻找用户输入的自定义标签,判断用户输入自定义标签中是否包含未录入标签;
C22)若是,则将用户自定义标签提交给语义相似度计算模块;
C23)若否,则将该标签在本体标签库中查找,并将标签关联的图片结果反馈给用户。
所述步骤C22)在用户输入的自定义标签包含未录入标签时,进行语义相似度模块计算,具体包含:
C221)相似度计算模块获取并计算用户输入的自定义标签,得到语义词向量;
C222)相似度计算模块参照自建语料库,对语义词向量进行相似度计算,根据相似度,得到用户自定义标签的同义标签;
C223)相似度计算模块把同义标签按相似程度递减排序,作为推荐提供给用户选择;
C224)若用户选择推荐的同义标签来替换原有用户自定义标签,则将用户选择推荐的同义标签在本体标签库中进行查找,并将该同义标签关联的图片作为结果反馈;
C225)若用户不选择推荐的同义标签,则按相似度递减,将所有推荐同义标签分别在本体标签库中的查找,并将关联结果反馈。
所述步骤C222)具体包含:
C2221)语义相似度计算采用基于本体和语料库结合的方法,语义相似度计算模块从本体标签库获取已有本体;
C2222)语义相似度计算模块获取用户输入用户查询自定义标签w1后,且该用户自定义标签在本体标签库中不存在,则该模块从本体图获取一个标签结点w2,在自建语料库中查询已存在的关联关系,按照一种语义相似度计算算法,计算w1和w2的语义相似度,记为sim(w1,w2);所述sim(w1,w2)计算方法如下:
a.计算标签结点深度:找出标签w1和w2结点在本体层次体系中所处层次数,根结点深度为0,所以记为depth(w1),depth(w2);
b.计算结点重合度:找出标签w1和w2在本体层次体系中所拥有相同父结点的路径长度,记为spd(w1,w2);
c.计算相异度:找出2个结点w1和w2在本体层次体系中沿父结点逐步上移,直到w1和w2到达第一个共同结点,走过的最短路径长度,记为dsd(w1,w2),相异度与语义距离等价;
d.根据深度、相异度、重合度对结点计算相似度,计算公式如下:
C2223)语义相似度计算模块依次遍历本体中所有结点,获取该查询关键词与所有结点的相似度,存储在自建语料库中。
与现有技术相比,本发明具有以下优点:
(1)构建数字媒体领域的知识本体,将标签库用本体关联关系存储在非结构化数据库中,通过标签与非结构化数据相关联,与关系型数据库相比较存储、修改更加灵活,查询更为快捷精准。
(2)通过计算语义相似相关度拓展用户的搜索条件,扩大了搜索结果的覆盖范围,更加便于用户查询到相关数据。
(3)通过多层语义计算模块得到多层语义标签,可以实现同种资源多种描述,有利于降低搜索关键词限制,提升查询结果的精确性。
(4)该方法能够根据图片源和标签数据库来更新实时更新本体库中标签权值,通过推理机制实现了自我淘汰与迭代功能,更具有时效性,准确度更高。
附图说明
图1是本发明提供的一种基于本体库的标签管理方法架构图。
图2是本发明提供的一种自建语料库建立方法图。
具体实施方式
下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
如图1所示,一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产进行标注,基于本体推理规则对语义标签动态更新,并基于本体库的标签搜索方法有利于提升媒体资产的管理效率。
所述多层语义标签提取具体为:
A1)用户通过管理端提交图片数据库到多层语义标签库模块;
A11)用户上传图片到图片数据库中;
A12)用户通过管理端对所有上传的图片进行审核,判断是否符合上传条件:
若是,则管理端提交图片到多层语义标签库模块;若否,则作审核不通过处理。
A2)多层语义标签库模块对管理端提交的图片数据库进行处理,得到基于本体的多层语义标签数据库,并输入到本体标签库中;
所述基于本体推理规则具体为:
B1)用户通过管理端提交标签数据库到基于本体推理规则的标签库生成模块;
B11)用户上传标签到标签数据库中;
B12)具有审核权限的用户通过管理端对上传的标签进行审核,判断是否符合上传条件:若是,则管理端提交标签到标签库;若否,则作审核不通过处理;
B13)标签数据库将标签提交到基于本体推理规则的标签库生成模块。
B2)基于本体推理规则的标签库生成模块获取本体标签库中内容,并将管理端输入的标签数据库与所获取的本体标签库中内容进行组合,得到混合的标签库;
B3)用户通过管理端建立本体规则库,随后基于本体推理规则的标签库生成模块结合规则库对混合标签库进行基于规则的推理、创建新的关联关系、淘汰掉冗余标签,得到最优化标签树;
B31)基于本体推理规则的标签库生成模块获取标签的相似度计算信息,为新加入标签创建与现有本体中标签结点的关联关系,得到新本体标签树;
B311)基于本体的多层次语义标签生成模块获取标签并输入本体标签库中,由基于本体推理规则的标签库生成模块创建标签的关联关系;
B312)手工调整,得到高可信度的本体标签关系,输入自建语料库保存;
B32)用户创建本体规则库,并将规则库与推理工具绑定;
B33)根据推理规则和标签树调整算法,推理机对标签树结点位置进行调整,删除无用结点,得到最优化标签树;
B4)基于本体推理规则的标签库生成模块向本体标签库发送最优化标签树,并更新本体标签库中内容;
如图2所示,所述基于本体库的标签搜索方法具体为:
C1)用户提交需要查询的用户自定义标签;
C11)将用户提交查询的自定义标签保存为查询记录,基于本体推理规则的标签生成模块将根据查询记录进行本体库中标签权重调整;
C12)将用户提交查询的自定义标签转化为本体标签库标签查询语言,并提交到本体标签库中查询;
C2)对用户自定义标签在本体标签库中进行查找,并将查找结果返回给用户;
C21)在本体标签库中寻找用户输入的自定义标签,判断用户输入自定义标签中是否包含未录入标签;
C22)若是,则将用户自定义标签提交给语义相似度计算模块;
C221)相似度计算模块获取并计算用户输入的自定义标签,得到语义词向量;
C222)相似度计算模块参照自建语料库,对语义词向量进行相似度计算,根据相似度,得到用户自定义标签的同义标签;
C2221)语义相似度计算采用基于本体和语料库结合的方法,语义相似度计算模块从本体标签库获取已有本体;
C2222)语义相似度计算模块获取用户输入用户查询自定义标签w1后,且该用户自定义标签在本体标签库中不存在,则该模块从本体图获取一个标签结点w2,在自建语料库中查询已存在的关联关系,按照一种语义相似度计算算法,计算w1和w2的语义相似度,记为sim(w1,w2);所述sim(w1,w2)计算方法如下:
a.计算标签结点深度:找出标签w1和w2结点在本体层次体系中所处层次数,根结点深度为0,所以记为depth(w1),depth(w2);
b.计算结点重合度:找出标签w1和w2在本体层次体系中所拥有相同父结点的路径长度,记为spd(w1,w2);
c.计算相异度:找出2个结点w1和w2在本体层次体系中沿父结点逐步上移,直到w1和w2到达第一个共同结点,走过的最短路径长度,记为dsd(w1,w2),相异度与语义距离等价;
d.根据深度、相异度、重合度对结点计算相似度,计算公式如下:
C2223)语义相似度计算模块依次遍历本体中所有结点,获取该查询关键词与所有结点的相似度,存储在自建语料库中;
C223)相似度计算模块把同义标签按相似程度递减排序,作为推荐提供给用户选择;
C224)若用户选择推荐的同义标签来替换原有用户自定义标签,则将用户选择推荐的同义标签在本体标签库中进行查找,并将该同义标签关联的图片作为结果反馈;
C225)若用户不选择推荐的同义标签,则按相似度递减,将所有推荐同义标签分别在本体标签库中的查找,并将关联结果反馈。
C23)若否,则将该标签在本体标签库中查找,并将标签关联的图片结果反馈给用户。
Claims (9)
1.一种基于本体库的标签管理方法,通过多层语义标签提取实现对媒体资产进行标注,基于本体推理规则对语义标签动态更新,并基于本体库的标签搜索方法有利于提升媒体资产的管理效率,其特征在于,
所述多层语义标签提取具体为:
A1)用户通过管理端提交图片数据库到多层语义标签库模块;
A2)多层语义标签库模块对管理端提交的图片数据库进行处理,得到基于本体的多层语义标签数据库,并输入到本体标签库中;
所述基于本体推理规则具体为:
B1)用户通过管理端提交标签数据库到基于本体推理规则的标签库生成模块;
B2)基于本体推理规则的标签库生成模块获取本体标签库中内容,并将管理端输入的标签数据库与所获取的本体标签库中内容进行组合,得到混合的标签库;
B3)用户通过管理端建立本体规则库,随后基于本体推理规则的标签库生成模块结合规则库对混合标签库进行基于规则的推理、创建新的关联关系、淘汰掉冗余标签,得到最优化标签树;
B4)基于本体推理规则的标签库生成模块向本体标签库发送最优化标签树,并更新本体标签库中内容;
所述基于本体库的标签搜索方法具体为:
C1)用户提交需要查询的用户自定义标签;
C2)对用户自定义标签在本体标签库中进行查找,并将查找结果返回给用户。
2.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤A1)具体包含:
A11)用户上传图片到图片数据库中;
A12)用户通过管理端对所有上传的图片进行审核,判断是否符合上传条件:
若是,则管理端提交图片到多层语义标签库模块;若否,则作审核不通过处理。
3.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤B1)具体包含:
B11)用户上传标签到标签数据库中;
B12)具有审核权限的用户通过管理端对上传的标签进行审核,判断是否符合上传条件:
若是,则管理端提交标签到标签库;若否,则作审核不通过处理;
B13)标签数据库将标签提交到基于本体推理规则的标签库生成模块。
4.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤B3)具体包含:
B31)基于本体推理规则的标签库生成模块获取标签的相似度计算信息,为新加入标签创建与现有本体中标签结点的关联关系,得到新本体标签树;
B32)用户创建本体规则库,并将规则库与推理工具绑定;
B33)根据推理规则和标签树调整算法,推理机对标签树结点位置进行调整,删除无用结点,得到最优化标签树。
5.根据权利要求4所述的基于本体库的标签管理方法,其特征在于,所述步骤B31)具体包含:
B311)基于本体的多层次语义标签生成模块获取标签并输入本体标签库中,由基于本体推理规则的标签库生成模块创建标签的关联关系;
B312)手工调整,得到高可信度的本体标签关系,输入自建语料库保存。
6.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤C1)具体包含:
C11)将用户提交查询的自定义标签保存为查询记录,基于本体推理规则的标签生成模块将根据查询记录进行本体库中标签权重调整;
C12)将用户提交查询的自定义标签转化为本体标签库标签查询语言,并提交到本体标签库中查询。
7.根据权利要求1所述的基于本体库的标签管理方法,其特征在于,所述步骤C2)具体包含:
C21)在本体标签库中寻找用户输入的自定义标签,判断用户输入自定义标签中是否包含未录入标签;
C22)若是,则将用户自定义标签提交给语义相似度计算模块;
C23)若否,则将该标签在本体标签库中查找,并将标签关联的图片结果反馈给用户。
8.根据权利要求7所述的基于本体库的标签管理方法,其特征在于,所述步骤C22)在用户输入的自定义标签包含未录入标签时,进行语义相似度模块计算,具体包含:
C221)相似度计算模块获取并计算用户输入的自定义标签,得到语义词向量;
C222)相似度计算模块参照自建语料库,对语义词向量进行相似度计算,根据相似度,得到用户自定义标签的同义标签;
C223)相似度计算模块把同义标签按相似程度递减排序,作为推荐提供给用户选择;
C224)若用户选择推荐的同义标签来替换原有用户自定义标签,则将用户选择推荐的同义标签在本体标签库中进行查找,并将该同义标签关联的图片作为结果反馈;
C225)若用户不选择推荐的同义标签,则按相似度递减,将所有推荐同义标签分别在本体标签库中的查找,并将关联结果反馈。
9.根据权利要求8所述的基于本体库的标签管理方法,其特征在于,所述步骤C222)具体包含:
C2221)语义相似度计算采用基于本体和语料库结合的方法,语义相似度计算模块从本体标签库获取已有本体;
C2222)语义相似度计算模块获取用户输入用户查询自定义标签w1后,且该用户自定义标签在本体标签库中不存在,则该模块从本体图获取一个标签结点w2,在自建语料库中查询已存在的关联关系,按照一种语义相似度计算算法,计算w1和w2的语义相似度,记为sim(w1,w2);所述sim(w1,w2)计算方法如下:
a.计算标签结点深度:找出标签w1和w2结点在本体层次体系中所处层次数,根结点深度为0,所以记为depth(w1),depth(w2);
b.计算结点重合度:找出标签w1和w2在本体层次体系中所拥有相同父结点的路径长度,记为spd(w1,w2);
c.计算相异度:找出2个结点w1和w2在本体层次体系中沿父结点逐步上移,直到w1和w2到达第一个共同结点,走过的最短路径长度,记为dsd(w1,w2),相异度与语义距离等价;
d.根据深度、相异度、重合度对结点计算相似度,计算公式如下:
<mrow>
<mi>s</mi>
<mi>i</mi>
<mi>m</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mn>1</mn>
<mo>,</mo>
<mi>w</mi>
<mn>2</mn>
<mo>)</mo>
</mrow>
<mo>=</mo>
<mfrac>
<mrow>
<mn>2</mn>
<mo>&times;</mo>
<mi>s</mi>
<mi>p</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mn>1</mn>
<mo>,</mo>
<mi>w</mi>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>d</mi>
<mi>s</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mn>1</mn>
<mo>,</mo>
<mi>w</mi>
<mn>2</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mn>2</mn>
<mo>&times;</mo>
<mi>s</mi>
<mi>p</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mn>1</mn>
<mo>,</mo>
<mi>w</mi>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
<mo>=</mo>
<mfrac>
<mrow>
<mn>2</mn>
<mo>&times;</mo>
<mi>s</mi>
<mi>p</mi>
<mi>d</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mn>1</mn>
<mo>,</mo>
<mi>w</mi>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
<mrow>
<mi>d</mi>
<mi>e</mi>
<mi>p</mi>
<mi>t</mi>
<mi>h</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mn>1</mn>
<mo>)</mo>
</mrow>
<mo>+</mo>
<mi>d</mi>
<mi>e</mi>
<mi>p</mi>
<mi>t</mi>
<mi>h</mi>
<mrow>
<mo>(</mo>
<mi>w</mi>
<mn>2</mn>
<mo>)</mo>
</mrow>
</mrow>
</mfrac>
</mrow>
C2223)语义相似度计算模块依次遍历本体中所有结点,获取该查询关键词与所有结点的相似度,存储在自建语料库中。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710539796.1A CN107491479B (zh) | 2017-07-05 | 2017-07-05 | 一种基于本体库的标签管理方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710539796.1A CN107491479B (zh) | 2017-07-05 | 2017-07-05 | 一种基于本体库的标签管理方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107491479A true CN107491479A (zh) | 2017-12-19 |
CN107491479B CN107491479B (zh) | 2020-11-24 |
Family
ID=60644652
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710539796.1A Expired - Fee Related CN107491479B (zh) | 2017-07-05 | 2017-07-05 | 一种基于本体库的标签管理方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107491479B (zh) |
Cited By (13)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763189A (zh) * | 2018-04-12 | 2018-11-06 | 武汉斗鱼网络科技有限公司 | 一种直播间内容标签权重计算方法、装置及电子设备 |
CN109409235A (zh) * | 2018-09-27 | 2019-03-01 | Oppo广东移动通信有限公司 | 图像识别方法和装置、电子设备、计算机可读存储介质 |
CN109977318A (zh) * | 2019-04-04 | 2019-07-05 | 掌阅科技股份有限公司 | 书籍搜索方法、电子设备及计算机存储介质 |
CN110147498A (zh) * | 2019-05-20 | 2019-08-20 | 东软集团股份有限公司 | 一种知识推送方法、装置及存储设备、程序产品 |
CN110647527A (zh) * | 2019-08-30 | 2020-01-03 | 北京百度网讯科技有限公司 | 基于大数据的无效标签清除方法及装置、设备与可读介质 |
CN110704642A (zh) * | 2019-10-12 | 2020-01-17 | 浙江大学 | 基于本体的多层次科技资源管理方法 |
CN111324724A (zh) * | 2020-02-13 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
CN111353055A (zh) * | 2020-03-02 | 2020-06-30 | 中国传媒大学 | 基于智能标签扩展元数据的编目方法及系统 |
CN111382352A (zh) * | 2020-03-02 | 2020-07-07 | 腾讯科技(深圳)有限公司 | 数据推荐方法、装置、计算机设备以及存储介质 |
CN112328920A (zh) * | 2020-11-06 | 2021-02-05 | 支付宝(杭州)信息技术有限公司 | 标签认证方法、标注方法以及各自装置 |
CN112464672A (zh) * | 2020-11-25 | 2021-03-09 | 重庆邮电大学 | 一种在物联网边缘设备中构建语义模型的优化方法 |
CN112699238A (zh) * | 2020-12-29 | 2021-04-23 | 厦门市美亚柏科信息股份有限公司 | 一种基于标签的知识本体构建方法、终端设备及存储介质 |
CN113268628A (zh) * | 2021-04-14 | 2021-08-17 | 上海大学 | 一种基于模块化的加权融合神经网络的音乐情感识别方法 |
Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101526898A (zh) * | 2009-04-17 | 2009-09-09 | 武汉大学 | 面向语义Web服务程序设计的语义数据表示和处理方法 |
CN101655862A (zh) * | 2009-08-11 | 2010-02-24 | 华天清 | 信息对象搜索的方法和装置 |
CN101794282A (zh) * | 2009-02-03 | 2010-08-04 | 日电(中国)有限公司 | 知识标注结果检查方法和系统 |
CN102982076A (zh) * | 2012-10-30 | 2013-03-20 | 新华通讯社 | 基于语义标签库的多维度内容标注方法 |
CN104346438A (zh) * | 2014-09-14 | 2015-02-11 | 北京航空航天大学 | 基于大数据数据管理服务系统 |
US9424520B1 (en) * | 2015-11-17 | 2016-08-23 | International Business Machines Corporation | Semantic database driven form validation |
CN105956144A (zh) * | 2016-05-13 | 2016-09-21 | 安徽教育网络出版有限公司 | 一种多标签学习资源关联度定量计算方法 |
CN106170012A (zh) * | 2016-06-29 | 2016-11-30 | 上海上大海润信息系统有限公司 | 一种面向云渲染的分布式文件系统及构建和访问方法 |
US20170039656A1 (en) * | 2013-06-25 | 2017-02-09 | Arthur Paul Drennan, III | System and method for evaluating text to support multiple insurance applications |
-
2017
- 2017-07-05 CN CN201710539796.1A patent/CN107491479B/zh not_active Expired - Fee Related
Patent Citations (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101794282A (zh) * | 2009-02-03 | 2010-08-04 | 日电(中国)有限公司 | 知识标注结果检查方法和系统 |
CN101526898A (zh) * | 2009-04-17 | 2009-09-09 | 武汉大学 | 面向语义Web服务程序设计的语义数据表示和处理方法 |
CN101655862A (zh) * | 2009-08-11 | 2010-02-24 | 华天清 | 信息对象搜索的方法和装置 |
CN102982076A (zh) * | 2012-10-30 | 2013-03-20 | 新华通讯社 | 基于语义标签库的多维度内容标注方法 |
US20170039656A1 (en) * | 2013-06-25 | 2017-02-09 | Arthur Paul Drennan, III | System and method for evaluating text to support multiple insurance applications |
CN104346438A (zh) * | 2014-09-14 | 2015-02-11 | 北京航空航天大学 | 基于大数据数据管理服务系统 |
US9424520B1 (en) * | 2015-11-17 | 2016-08-23 | International Business Machines Corporation | Semantic database driven form validation |
CN105956144A (zh) * | 2016-05-13 | 2016-09-21 | 安徽教育网络出版有限公司 | 一种多标签学习资源关联度定量计算方法 |
CN106170012A (zh) * | 2016-06-29 | 2016-11-30 | 上海上大海润信息系统有限公司 | 一种面向云渲染的分布式文件系统及构建和访问方法 |
Cited By (20)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108763189B (zh) * | 2018-04-12 | 2022-03-25 | 武汉斗鱼网络科技有限公司 | 一种直播间内容标签权重计算方法、装置及电子设备 |
CN108763189A (zh) * | 2018-04-12 | 2018-11-06 | 武汉斗鱼网络科技有限公司 | 一种直播间内容标签权重计算方法、装置及电子设备 |
CN109409235A (zh) * | 2018-09-27 | 2019-03-01 | Oppo广东移动通信有限公司 | 图像识别方法和装置、电子设备、计算机可读存储介质 |
CN109977318B (zh) * | 2019-04-04 | 2021-06-29 | 掌阅科技股份有限公司 | 书籍搜索方法、电子设备及计算机存储介质 |
CN109977318A (zh) * | 2019-04-04 | 2019-07-05 | 掌阅科技股份有限公司 | 书籍搜索方法、电子设备及计算机存储介质 |
CN110147498A (zh) * | 2019-05-20 | 2019-08-20 | 东软集团股份有限公司 | 一种知识推送方法、装置及存储设备、程序产品 |
CN110647527A (zh) * | 2019-08-30 | 2020-01-03 | 北京百度网讯科技有限公司 | 基于大数据的无效标签清除方法及装置、设备与可读介质 |
CN110704642B (zh) * | 2019-10-12 | 2022-02-01 | 浙江大学 | 基于本体的多层次科技资源管理方法 |
CN110704642A (zh) * | 2019-10-12 | 2020-01-17 | 浙江大学 | 基于本体的多层次科技资源管理方法 |
CN111324724A (zh) * | 2020-02-13 | 2020-06-23 | 腾讯科技(深圳)有限公司 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
CN111324724B (zh) * | 2020-02-13 | 2023-04-11 | 腾讯科技(深圳)有限公司 | 数据处理方法及装置、电子设备和计算机可读存储介质 |
CN111382352A (zh) * | 2020-03-02 | 2020-07-07 | 腾讯科技(深圳)有限公司 | 数据推荐方法、装置、计算机设备以及存储介质 |
CN111353055A (zh) * | 2020-03-02 | 2020-06-30 | 中国传媒大学 | 基于智能标签扩展元数据的编目方法及系统 |
WO2021174890A1 (zh) * | 2020-03-02 | 2021-09-10 | 腾讯科技(深圳)有限公司 | 数据推荐方法、装置、计算机设备以及存储介质 |
CN111353055B (zh) * | 2020-03-02 | 2024-04-16 | 中国传媒大学 | 基于智能标签扩展元数据的编目方法及系统 |
CN112328920A (zh) * | 2020-11-06 | 2021-02-05 | 支付宝(杭州)信息技术有限公司 | 标签认证方法、标注方法以及各自装置 |
CN112464672A (zh) * | 2020-11-25 | 2021-03-09 | 重庆邮电大学 | 一种在物联网边缘设备中构建语义模型的优化方法 |
CN112464672B (zh) * | 2020-11-25 | 2023-06-09 | 北京华软数创科技集团有限公司 | 一种在物联网边缘设备中构建语义模型的优化方法 |
CN112699238A (zh) * | 2020-12-29 | 2021-04-23 | 厦门市美亚柏科信息股份有限公司 | 一种基于标签的知识本体构建方法、终端设备及存储介质 |
CN113268628A (zh) * | 2021-04-14 | 2021-08-17 | 上海大学 | 一种基于模块化的加权融合神经网络的音乐情感识别方法 |
Also Published As
Publication number | Publication date |
---|---|
CN107491479B (zh) | 2020-11-24 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107491479A (zh) | 一种基于本体库的标签管理方法 | |
CN111274811B (zh) | 地址文本相似度确定方法以及地址搜索方法 | |
Yang et al. | A hybrid retrieval-generation neural conversation model | |
CN108038183B (zh) | 结构化实体收录方法、装置、服务器和存储介质 | |
CN113343125B (zh) | 一种面向学术精准推荐的异质科研信息集成方法及系统 | |
CN108829822A (zh) | 媒体内容的推荐方法和装置、存储介质、电子装置 | |
CN108268600B (zh) | 基于ai的非结构化数据管理方法及装置 | |
US20160378863A1 (en) | Selecting representative video frames for videos | |
CN109299383B (zh) | 生成推荐词的方法、装置、电子设备及存储介质 | |
CN111127385A (zh) | 基于生成式对抗网络的医学信息跨模态哈希编码学习方法 | |
WO2024099037A1 (zh) | 数据处理、实体链接方法、装置和计算机设备 | |
CN116703531B (zh) | 物品数据处理方法、装置、计算机设备和存储介质 | |
US7792826B2 (en) | Method and system for providing ranked search results | |
CN111241310A (zh) | 一种深度跨模态哈希检索方法、设备及介质 | |
CN114706989A (zh) | 一种基于技术创新资产为知识库的智能推荐方法 | |
CN111026787A (zh) | 网点检索方法、装置及系统 | |
CN118296126A (zh) | 对话处理方法、系统、电子设备及计算机可读存储介质 | |
CN114626926A (zh) | 商品搜索类目识别方法及其装置、设备、介质、产品 | |
JP7121819B2 (ja) | 画像処理方法及び装置、電子機器、コンピュータ可読記憶媒体並びにコンピュータプログラム | |
Prasomphan | Toward Fine-grained Image Retrieval with Adaptive Deep Learning for Cultural Heritage Image. | |
Zidi et al. | An ontology-based personalized retrieval model using case base reasoning | |
CN117435685A (zh) | 文档检索方法、装置、计算机设备、存储介质和产品 | |
CN115797795B (zh) | 基于强化学习的遥感影像问答式检索系统及方法 | |
CN114254622B (zh) | 一种意图识别方法和装置 | |
CN102982072B (zh) | 一种可视化概念检测器及构造语义场的方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20201124 |
|
CF01 | Termination of patent right due to non-payment of annual fee |