CN109145098B - 基于知识图谱的中华文化元素信息搜索方法 - Google Patents
基于知识图谱的中华文化元素信息搜索方法 Download PDFInfo
- Publication number
- CN109145098B CN109145098B CN201810803809.6A CN201810803809A CN109145098B CN 109145098 B CN109145098 B CN 109145098B CN 201810803809 A CN201810803809 A CN 201810803809A CN 109145098 B CN109145098 B CN 109145098B
- Authority
- CN
- China
- Prior art keywords
- knowledge graph
- elements
- source data
- chinese culture
- graph
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Images
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于知识图谱的中华文化元素信息搜索方法,包括以下步骤:步骤1,获取包含中华文化元素的多个源数据;步骤2,对获得的多个源数据进行预处理,得到多个预处理后的数据源,并对多个预处理后的数据源进行本地地址ID编号,得到ID编号后的源数据;步骤3,根据ID编号后的源数据,构建知识图谱;步骤4,将所构建的知识图谱中的元素ID编号导入attrbuteRelation表单中,将知识图谱中的元素之间的关系信息导入attrLink表单中;步骤5,构建中华文化元素数据库,将attrbuteRelation表单和attrLink表单导入数据库中;步骤6,使用PHP语言设计基于中华文化元素数据库的搜索页面。本发明提高了对中华文化元素图片的搜索效率和搜索精度。
Description
技术领域
本发明属于图像信息搜索领域,具体涉及一种基于知识图谱的中华文化元素信息搜索方法。
背景技术
图像信息搜索是对传统文本信息关键词搜索技术的继承与延伸,目前有两种搜索方式,一种是基于文本的关键词图像信息搜索,另一种是基于图片的图像搜索,例如阿里巴巴目前已经实现的,通过“扫一扫”对现有图片进行类似搜索,还有目前很热门的“图图搜”,都是基于图片的图像搜索。现有的基于图像的搜索,大多使用深度学习、数据挖掘等现有的模型去训练数据并搜索数据,虽然是在大数据背景下的图片搜索,但是这些图片搜索方法往往存在着搜索目标过大,搜索结果过于复杂、冗余、不利于用户的直接选择等缺点。
发明内容
针对现有技术中存在的不足,本发明的目的在于,提供一种基于知识图谱的中华文化元素信息搜索方法,解决现有技术无法对含有中华元素的图片进行有效性、针对性搜索的技术问题。
为了解决上述技术问题,本申请采用如下技术方案予以实现:
一种基于知识图谱的中华文化元素信息搜索方法,包括以下步骤:
步骤1,获取包含中华文化元素的多个源数据;
步骤2,对获得的多个源数据进行预处理,得到多个预处理后的数据源,并对多个预处理后的数据源进行本地地址ID编号,得到ID编号后的源数据;
步骤3,根据ID编号后的源数据,构建知识图谱,所述知识图谱包括元素的ID编号和元素之间的关系信息;
步骤4,建立用于记录知识图谱中元素ID编号的attrbuteRelation表单和用于记录知识图中元素之间关系信息的attrLink表单,将知识图谱中元素的ID编号导入attrbuteRelation表单中,将知识图谱中元素之间的关系信息导入attrLink表单中;
步骤5,构建中华文化元素数据库,将attrbuteRelation表单和attrLink表单导入数据库中;
步骤6,使用PHP语言设计基于中华文化元素数据库的搜索页面。
进一步地,所述步骤3中根据ID编号后的源数据,构建知识图谱,包括:
步骤31,将ID编号后的源数据加载到Prefuse可视化系统框架中;
步骤32,根据加载到Prefuse可视化系统框架中的源数据,创建
Visualization对象;
步骤33,使用Renderers渲染器绘制Visualization对象中的VisualItems,以创建RenderFactory;
步骤34,构造visual abstraction上的数据处理动作,完成初始知识图谱构建;
步骤35,将初始知识图谱中所有超过预设阈值路径的多余枝节减掉,生成知识图谱。
进一步地,所述步骤35中将初始知识图谱中所有超过预设阈值路径的多余枝节减掉,生成知识图谱,包括:
步骤351,设在初始知识图谱中需要搜索的元素为需搜索元素,在初始知识图谱中任选一个元素作为当前元素;
步骤352,若从当前元素开始在初始知识图谱中搜索直至到预设阈值条路径时,没有搜索到需搜索元素,则将初始知识图谱中该路径去除;否则,保留该路径。
步骤353,重复步骤352,直至初始知识图谱中所有的元素均被作为当前元素,得到知识图谱。
本发明与现有技术相比,有益的技术效果是:
(1)本发明在图像特征提取阶段,采用了模式识别的方式提取中华文化元素,细化了元素种类,也提高了元素的文化特性指标;
(2)本发明在元素关系构建阶段,引入知识图谱方法建立元素关系,其中所有的数据源均与中华文化元素相关,并且充分考虑了用户的使用习惯,针对性地建立元素模型,并且在此基础上建立搜索关系模型,并对大于预设阈值的关系路径进行去除,提高了后期搜素呈现的效率,同时也提高了搜索精度。
附图说明
图1为源数据示例图;
图2为知识图谱的构建过程示意图;
图3为对初始知识图谱进行剪枝后的知识图谱;
图4为一种示例下加载源数据到Prefuse的示意图
图5为一种示例下创建的RenderFactory;
图6为一种示例下attrbuteRelation表单的示意图;
图7为一种示例下attrLink表单的示意图;
图8为一种示例下的搜索页面;
图9为本发明的用例图;
以下结合附图和实施例对本发明的具体内容作进一步详细解释说明。
具体实施方式
以下给出本发明的具体实施例,需要说明的是本发明并不局限于以下具体实施例,凡在本申请技术方案基础上做的等同变换均落入本发明的保护范围。
实施例:
本实施例提供了一种基于知识图谱的中华文化元素信息搜索方法,包括以下步骤:
步骤1,获取包含中华文化元素的多个源数据;
本实施例通过爬虫工具对各网站上含有中华文化元素的图片进行爬取;如图1为通过爬虫工具爬取的图片示意图。
步骤2,对多个源数据进行预处理,得到多个预处理后的数据源,并对多个预处理后的数据源进行本地地址ID编号,得到ID编号后的源数据;
本实施例中通过模式识别对源数据进行特征提取,所提取特征包括元素种类、名称等;
步骤3,根据ID编号后的源数据,构建知识图谱,所述知识图谱包括元素的ID编号和元素之间的关系信息;
所述步骤3中根据ID编号后的源数据,构建知识图谱,如图2所示,包括:
步骤31,将ID编号后的源数据加载到Prefuse可视化系统框架中;其相关代码如图3所示,图3中所加载的源数据为“/socialnet.xml”。
步骤32,根据加载到Prefuse可视化系统框架中的源数据,创建
Visualization对象;
步骤33,使用Renderers渲染器绘制Visualization对象中的VisualItems,以创建RenderFactory;
本实施例中默认情况下,Visualization类中包含了DefaultRendererFactory,其使用EdgeRenderer(默认绘制直连边)、ShapeRenderer绘制图形(比如正方形或三角形)。如果想要看到节点上标签值可以创建一个LabelRenderers,在创建之后为标签数据域赋相应的值。如图4所示为本实施例创建的
RenderFactory。
步骤34,构造visual abstraction上的数据处理动作,完成初始知识图谱构建;
所构造visual abstraction上的数据处理动作可以是任何事情,常用的包括:设置可视化项目的位置、颜色、大小和形状,动作实例可以组成ActionLists的形式用于执行各种处理任务,能够直接触发的动作被加入Visualization,并且赋予一个唯一的名字用于引用。
步骤35,将初始知识图谱中所有超过预设阈值路径的多余枝节减掉,生成知识图谱。
所述步骤35中将初始知识图谱中所有超过预设阈值路径的多余枝节减掉,生成知识图谱,包括:
步骤351,设在初始知识图谱中需要搜索的元素为需搜索元素,在初始知识图谱中任选一个元素作为当前元素;
步骤352,若从当前元素开始在初始知识图谱中搜索直至到预设阈值条路径时,没有搜索到需搜索元素,则将初始知识图谱中该路径去除;否则,保留该路径。
步骤353,重复步骤352,直至初始知识图谱中所有的元素均被作为当前元素,得到知识图谱。
图3为对初始知识图谱进行剪枝后的知识图谱。
步骤4,建立用于记录知识图谱中元素ID编号的attrbuteRelation表单和用于记录知识图中元素之间关系信息的attrLink表单,将步骤3所构建的知识图谱中的元素ID编号导入attrbuteRelation表单中,将步骤3所构建的知识图谱中的元素之间的关系信息导入attrLink表单中;如图6为本实施例建立的attrbuteRelation表单,图7为本实施例建立的attrLink表单。
步骤5,构建中华文化元素数据库,将attrbuteRelation表单和attrLink表单导入数据库中;
步骤6,使用PHP语言设计基于中华文化元素数据库的搜索页面。如图8为当需搜索元素为“龙”时的搜索页面。
Claims (2)
1.一种基于知识图谱的中华文化元素信息搜索方法,其特征在于,包括以下步骤:
步骤1,获取包含中华文化元素的多个源数据;
步骤2,对获得的多个源数据进行预处理,得到多个预处理后的数据源,并对多个预处理后的数据源进行本地地址ID编号,得到ID编号后的源数据;
步骤3,根据ID编号后的源数据,构建知识图谱,所述知识图谱包括元素的ID编号和元素之间的关系信息;
步骤4,建立用于记录知识图谱中元素ID编号的attrbuteRelation表单和用于记录知识图中元素之间关系信息的attrLink表单,将知识图谱中元素的ID编号导入attrbuteRelation表单中,将知识图谱中元素之间的关系信息导入attrLink表单中;
步骤5,构建中华文化元素数据库,将attrbuteRelation表单和attrLink表单导入数据库中;
步骤6,使用PHP语言设计基于中华文化元素数据库的搜索页面;
所述步骤3中根据ID编号后的源数据,构建知识图谱,包括:
步骤31,将ID编号后的源数据加载到Prefuse可视化系统框架中;
步骤32,根据加载到Prefuse可视化系统框架中的源数据,创建Visualization对象;
步骤33,使用Renderers渲染器绘制Visualization对象中的VisualItems;
步骤34,构造visual abstraction上的数据处理动作,完成初始知识图谱构建;
步骤35,将初始知识图谱中所有超过预设阈值路径的多余枝节减掉,生成知识图谱。
2.根据权利要求1所述的基于知识图谱的中华文化元素信息搜索方法,其特征在于,所述步骤35中将初始知识图谱中所有超过预设阈值路径的多余枝节减掉,生成知识图谱,包括:
步骤351,设在初始知识图谱中需要搜索的元素为需搜索元素,在初始知识图谱中任选一个元素作为当前元素;
步骤352,若从当前元素开始在初始知识图谱中搜索直至到预设阈值条路径时,没有搜索到需搜索元素,则将初始知识图谱中该路径去除;否则,保留该路径;
步骤353,重复步骤352,直至初始知识图谱中所有的元素均被作为当前元素,得到知识图谱。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810803809.6A CN109145098B (zh) | 2018-07-20 | 2018-07-20 | 基于知识图谱的中华文化元素信息搜索方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201810803809.6A CN109145098B (zh) | 2018-07-20 | 2018-07-20 | 基于知识图谱的中华文化元素信息搜索方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN109145098A CN109145098A (zh) | 2019-01-04 |
CN109145098B true CN109145098B (zh) | 2021-10-29 |
Family
ID=64801351
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201810803809.6A Active CN109145098B (zh) | 2018-07-20 | 2018-07-20 | 基于知识图谱的中华文化元素信息搜索方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN109145098B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112052341A (zh) * | 2020-09-03 | 2020-12-08 | 中国银行股份有限公司 | 知识图谱剪枝方法及装置 |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462460A (zh) * | 2014-12-16 | 2015-03-25 | 武汉理工大学 | 一种构造rest风格的本体标注可视化系统的方法 |
CN104866593A (zh) * | 2015-05-29 | 2015-08-26 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的数据库搜索方法 |
CN106355627A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 一种用于生成知识图谱的方法及系统 |
CN106815307A (zh) * | 2016-12-16 | 2017-06-09 | 中国科学院自动化研究所 | 公共文化知识图谱平台及其使用办法 |
CN107748754A (zh) * | 2017-09-15 | 2018-03-02 | 广州唯品会研究院有限公司 | 一种知识图谱完善方法和装置 |
CN107861971A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种商品搜索方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20180052884A1 (en) * | 2016-08-16 | 2018-02-22 | Ebay Inc. | Knowledge graph construction for intelligent online personal assistant |
-
2018
- 2018-07-20 CN CN201810803809.6A patent/CN109145098B/zh active Active
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104462460A (zh) * | 2014-12-16 | 2015-03-25 | 武汉理工大学 | 一种构造rest风格的本体标注可视化系统的方法 |
CN104866593A (zh) * | 2015-05-29 | 2015-08-26 | 中国电子科技集团公司第二十八研究所 | 一种基于知识图谱的数据库搜索方法 |
CN106355627A (zh) * | 2015-07-16 | 2017-01-25 | 中国石油化工股份有限公司 | 一种用于生成知识图谱的方法及系统 |
CN106815307A (zh) * | 2016-12-16 | 2017-06-09 | 中国科学院自动化研究所 | 公共文化知识图谱平台及其使用办法 |
CN107748754A (zh) * | 2017-09-15 | 2018-03-02 | 广州唯品会研究院有限公司 | 一种知识图谱完善方法和装置 |
CN107861971A (zh) * | 2017-09-15 | 2018-03-30 | 广州唯品会研究院有限公司 | 一种商品搜索方法和装置 |
Non-Patent Citations (1)
Title |
---|
基于Citespace 的中国传统村落研究知识图谱分析;李伯华 等;《经济地理》;20170930;第37卷(第9期);第207-208页 * |
Also Published As
Publication number | Publication date |
---|---|
CN109145098A (zh) | 2019-01-04 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Fan et al. | Paint mesh cutting | |
CN110457502B (zh) | 构建知识图谱方法、人机交互方法、电子设备及存储介质 | |
CN105930159A (zh) | 一种基于图像的界面代码生成的方法及系统 | |
CN104809142A (zh) | 商标查询系统和方法 | |
Fan et al. | Modeling by drawing with shadow guidance | |
CN104484347B (zh) | 一种基于地理信息的层次化视觉特征提取方法 | |
CN117058271A (zh) | 用于生成商品主图背景的方法及计算设备 | |
Xiao et al. | Vismantic: Meaning-making with Images. | |
CN108305306B (zh) | 一种基于草图交互的动画数据组织方法 | |
Hmida et al. | Knowledge base approach for 3d objects detection in point clouds using 3d processing and specialists knowledge | |
CN112487212A (zh) | 领域知识图谱的构建方法及装置 | |
CN107608981B (zh) | 基于正则表达式的字符匹配方法及系统 | |
CN109145098B (zh) | 基于知识图谱的中华文化元素信息搜索方法 | |
CN111177404A (zh) | 家装知识的知识图谱构建方法、装置、计算机设备 | |
Teboul | Shape grammar parsing: Application to image-based modeling | |
US20130271460A1 (en) | Apparatus and method for generating 3d tree images | |
CN104504104B (zh) | 用于搜索引擎的图片物料处理方法、装置和搜索引擎 | |
CN111078724A (zh) | 学习系统中的测试题检索方法、装置、设备及存储介质 | |
CN103970745A (zh) | 一种网络文字作品实时生成动画作品的方法与系统 | |
CN112860704B (zh) | 家谱数据的处理方法及装置 | |
Tsai et al. | An intelligent recommendation system for animation scriptwriters’ education | |
CN114281884A (zh) | 知识图谱的主题知识子模型提取方法 | |
Park et al. | Ensuring Visual Commonsense Morality for Text-to-Image Generation | |
Hu et al. | Efficient procedural modelling of building Façades based on windows from sketches | |
Zhang et al. | Interactive creation of Chinese calligraphy with the application in calligraphy education |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |