CN116595191A - 一种交互式低代码知识图谱的构建方法及装置 - Google Patents
一种交互式低代码知识图谱的构建方法及装置 Download PDFInfo
- Publication number
- CN116595191A CN116595191A CN202310557304.7A CN202310557304A CN116595191A CN 116595191 A CN116595191 A CN 116595191A CN 202310557304 A CN202310557304 A CN 202310557304A CN 116595191 A CN116595191 A CN 116595191A
- Authority
- CN
- China
- Prior art keywords
- knowledge
- data
- graph
- knowledge graph
- user
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000002452 interceptive effect Effects 0.000 title claims abstract description 63
- 238000010276 construction Methods 0.000 title claims abstract description 27
- 238000000034 method Methods 0.000 claims abstract description 60
- 238000004422 calculation algorithm Methods 0.000 claims description 23
- 230000006870 function Effects 0.000 claims description 21
- 238000004458 analytical method Methods 0.000 claims description 14
- 238000004590 computer program Methods 0.000 claims description 14
- 238000012216 screening Methods 0.000 claims description 14
- 238000003860 storage Methods 0.000 claims description 9
- 238000007781 pre-processing Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 6
- 238000013507 mapping Methods 0.000 claims description 6
- 238000013135 deep learning Methods 0.000 claims description 5
- 238000011161 development Methods 0.000 claims description 5
- 230000006698 induction Effects 0.000 claims description 5
- 238000012545 processing Methods 0.000 claims description 5
- 238000006243 chemical reaction Methods 0.000 claims description 4
- 238000004140 cleaning Methods 0.000 claims description 4
- 238000001914 filtration Methods 0.000 claims description 4
- 238000012937 correction Methods 0.000 claims description 3
- 238000013441 quality evaluation Methods 0.000 claims description 3
- 238000010586 diagram Methods 0.000 description 14
- 238000007726 management method Methods 0.000 description 14
- 239000008186 active pharmaceutical agent Substances 0.000 description 13
- 238000005516 engineering process Methods 0.000 description 12
- 230000004927 fusion Effects 0.000 description 10
- 238000012800 visualization Methods 0.000 description 8
- 230000003993 interaction Effects 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 238000011156 evaluation Methods 0.000 description 5
- 238000005065 mining Methods 0.000 description 4
- 230000008859 change Effects 0.000 description 3
- 230000008676 import Effects 0.000 description 3
- 238000003058 natural language processing Methods 0.000 description 3
- 230000000007 visual effect Effects 0.000 description 3
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 3
- 241001465754 Metazoa Species 0.000 description 2
- 230000033228 biological regulation Effects 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000008094 contradictory effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000007613 environmental effect Effects 0.000 description 2
- 238000000605 extraction Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 238000012423 maintenance Methods 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000001303 quality assessment method Methods 0.000 description 2
- 238000011160 research Methods 0.000 description 2
- 230000008093 supporting effect Effects 0.000 description 2
- 230000001360 synchronised effect Effects 0.000 description 2
- 206010039203 Road traffic accident Diseases 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 239000005441 aurora Substances 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000013079 data visualisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000003814 drug Substances 0.000 description 1
- 230000008451 emotion Effects 0.000 description 1
- 238000004134 energy conservation Methods 0.000 description 1
- 238000013210 evaluation model Methods 0.000 description 1
- 230000001976 improved effect Effects 0.000 description 1
- 230000001939 inductive effect Effects 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000003012 network analysis Methods 0.000 description 1
- 238000005457 optimization Methods 0.000 description 1
- 230000008520 organization Effects 0.000 description 1
- 230000001737 promoting effect Effects 0.000 description 1
- 238000012827 research and development Methods 0.000 description 1
- 231100000279 safety data Toxicity 0.000 description 1
- 238000000926 separation method Methods 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
- 238000007619 statistical method Methods 0.000 description 1
- 230000026676 system process Effects 0.000 description 1
- 230000009897 systematic effect Effects 0.000 description 1
- 238000012360 testing method Methods 0.000 description 1
- 238000012549 training Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F3/00—Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
- G06F3/01—Input arrangements or combined input and output arrangements for interaction between user and computer
- G06F3/048—Interaction techniques based on graphical user interfaces [GUI]
- G06F3/0484—Interaction techniques based on graphical user interfaces [GUI] for the control of specific functions or operations, e.g. selecting or manipulating an object, an image or a displayed text element, setting a parameter value or selecting a range
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F9/00—Arrangements for program control, e.g. control units
- G06F9/06—Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
- G06F9/44—Arrangements for executing specific programs
- G06F9/451—Execution arrangements for user interfaces
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N5/00—Computing arrangements using knowledge-based models
- G06N5/02—Knowledge representation; Symbolic representation
- G06N5/022—Knowledge engineering; Knowledge acquisition
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- Software Systems (AREA)
- General Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Computational Linguistics (AREA)
- Human Computer Interaction (AREA)
- Databases & Information Systems (AREA)
- Life Sciences & Earth Sciences (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Animal Behavior & Ethology (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种交互式低代码知识图谱的构建方法及装置,本方法包括首先获取用户输入的知识点及其相关属性;根据知识点及其属性构建知识点图形表示;然后将知识点图形表示布置在知识图谱空间内,形成初步知识图谱;根据用户的拖拽、连接操作,在知识图谱空间内构建知识点之间的关联关系;根据用户的操作,在知识图谱空间内添加、删除或修改知识点及其属性;最后通过用户的操作,不断优化和完善知识图谱,形成交互式低代码知识图谱。本发明可以实现交互式构建知识图谱,提高知识管理的效率和灵活性,适用于各行业的知识管理需求。
Description
技术领域
本发明涉及知识图谱技术领域,特别涉及一种交互式低代码知识图谱的构建方法及装置。
背景技术
知识图谱,在图书情报界被称为知识域可视化或知识领域映射地图,是显示知识发展进程与结构关系的一系列各种不同的图形,它在检索领域被广泛地应用。通过构建知识点、知识关系等构建知识图谱,可有效整合和展示知识,为用户提供直观的知识体系概览。
现有针对新一代信息技术、高端装备制造、新材料、新能源、节能环保、生物医药等行业细分领域的评价指标信息较为庞杂,在进行评价时人们查阅信息只能通过零散的内容进行分类,然而在检索时存在检索效率低的问题。
发明内容
基于此,本申请实施例提供了一种交互式低代码知识图谱的构建方法及装置,能够实现用户的知识可视化,提升了用户的数据智能化管理水平,同时提高了检索效率。
第一方面,提供了一种交互式低代码知识图谱的构建方法,该方法包括:
获取用户输入的知识点及其相关属性,根据知识点及其相关属性构建知识点图形表示;
将知识点图形表示布置在知识图谱空间内,形成初步知识图谱;
根据用户的拖拽、连接操作,在知识图谱空间内构建知识点之间的关联关系;根据用户的操作在知识图谱空间内添加、删除或修改知识点及其属性;并进一步迭代优化和完善知识图谱,形成交互式低代码知识图谱。
可选地,在获取用户输入的知识点及其相关属性之前,包括对原始数据进行预处理,具体包括:
将采集到的原始数据进行数据去重、低质数据过滤、多样数据统一、模糊数据转换、噪声数据清洗,并转换为统一的格式;其中,所述原始数据可以包括文本、语音、图片等多种模态数据;所述原始数据的数据源包括mysql、elk、hbase、es、csv文件数据源;
对原始数据进行采集,当原始数据不符合处理预格式时,利用输入格式模板库中的模板调整为符合预处理格式的数据。
可选地,对原始数据进行预处理,还包括:
根据预设筛选规则,筛选原始数据中质量评估合格的数据,预设筛选规则包括剔除原始数据中不满足映射关系的数据、剔除数据中的含有不被识别符号的数据、剔除数据中的值为空的数据、剔除原始数据中实体标识重复的数据以及剔除原始数据中实体之间关系矛盾的数据。
可选地,所述知识点图形表示布置在知识图谱空间内,形成初步知识图谱,包括:
从文本、数据库或其他数据源中提取关键的概念、实体和关系提取出知识点;将所提取的知识点表示为节点,将关系表示为边,进行图结构的构建;
使用图形布局算法将知识图谱在二维或三维空间中进行可视化展示;其中,所述图形布局算法至少包括力导向布局和圆形布局。
可选地,使用图形布局算法将知识图谱在二维或三维空间中进行可视化展示,还包括:
通过API接口将构建完成的知识图谱在用户端进行可视化展示,并根据用户所调用的组件得到图谱分析结果,包括:
通过网页端HTML、移动端H5、数据API方式对外部系统提供服务及调用,供业务系统调用,满足各种通用场景;其中,还支持RESTfulAPI接口类型;
还包括根据用户自定义实现配置数据、分配权限、和设置展现方式中的一种或多种功能;
其中,所述API接口至少包括:
AI通用服务接口,用于根据通用搜索请求实现语义搜索、智能推荐、专家建议以及其他服务功能;
AI开发服务接口,用于实现内容标签、偏好分析、数据托管以及模型托管功能;
AI定制服务接口,用于根据定制搜索请求实现定制化的语义搜索、智能推荐、专家建议以及其他服务功能。
可选地,根据用户的操作不断优化和完善知识图谱,包括:
建立交互式界面,以使用户在所述交互式界面中进行浏览、搜索、编辑和添加知识点和关系;用户可以对知识图谱的准确性和完整性提供反馈,如纠错、补充信息等;根据用户的操作和反馈,实时更新知识图谱,优化布局和展示效果。
可选地,将知识点图形表示布置在知识图谱空间内,形成初步知识图谱,具体包括:
基于图相关的深度学习归纳推理方法和基于逻辑或规则的演绎推理方法构建知识图谱,通过内置NLP规则模型、词典、算法模型完善图谱的语义信息。
第二方面,提供了一种交互式低代码知识图谱的构建装置,该装置包括:
输入模块,获取用户输入的知识点及其相关属性,根据知识点及其相关属性构建知识点图形表示;
布置模块,用于将知识点图形表示布置在知识图谱空间内,形成初步知识图谱;
关联关系构建模块,用于根据用户的拖拽、连接操作,在知识图谱空间内构建知识点之间的关联关系;
知识图谱优化模块,用于根据用户的操作,在知识图谱空间内添加、删除或修改知识点及其属性;
知识图谱形成模块,用于通过用户的操作,迭代优化和完善知识图谱,形成交互式低代码知识图谱。
第三方面,提供了一种电子设备,包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面任一所述的交互式低代码知识图谱的构建方法。
第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述第一方面任一所述的交互式低代码知识图谱的构建方法。
本申请实施例提供的技术方案中首先获取用户输入的知识点及其相关属性;根据知识点及其属性构建知识点图形表示;将知识点图形表示布置在知识图谱空间内,形成初步知识图谱;根据用户的拖拽、连接操作,在知识图谱空间内构建知识点之间的关联关系;根据用户的操作,在知识图谱空间内添加、删除或修改知识点及其属性;通过用户的操作,不断优化和完善知识图谱,形成交互式低代码知识图谱。可以看出,本发明的有益效果在于实现了用户的知识可视化,提升了用户的数据智能化管理水平,同时提高了检索效率。
附图说明
为了更清楚地说明本发明的实施方式或现有技术中的技术方案,下面将对实施方式或现有技术描述中所需要使用的附图作简单地介绍。显而易见地,下面描述中的附图仅仅是示例性的,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图引申获得其它的实施附图。
图1为本申请实施例提供的一种交互式低代码知识图谱的构建方法流程图;
图2为本申请实施例提供的知识图谱技术架构示意图;
图3为本申请实施例提供的政策画像图谱示意图;
图4为本申请实施例提供的企业画像图谱示意图;
图5为本申请实施例提供的政策企业画像图谱信息关联示意图;
图6为本申请实施例提供的知识图谱中API接口信息交互示意图;
图7为本申请实施例提供的一种交互式低代码知识图谱的构建装置的框图;
图8为本申请实施例提供的一种电子设备的示意图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
在本发明的描述中,术语“包括”、“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包括了一系列步骤或单元的过程、方法、系统、产品或设备不必限于已明确列出的那些步骤或单元,而是还可包含虽然并未明确列出的但对于这些过程、方法、产品或设备固有的其它步骤或单元,或者基于本发明构思进一步的优化方案所增加的步骤或单元。
在本申请的技术背景中首先对主要技术进行介绍:
知识图谱技术:通过构建知识点、知识关系等构建知识图谱,可有效整合和展示知识,为用户提供直观的知识体系概览。
低代码技术:通过简单的拖拽、配置等操作,无需复杂的编程,就可以快速构建知识图谱应用,适合非技术人员使用。
交互技术:采用交互式设计,通过点击、拖拽等操作,用户可以动态调整知识图谱的结构和内容,实现知识的定制化展示。
本申请中所公开的这种交互式低代码知识图谱的构建方法及装,具体的用处可以包括简化知识管理,具体通过图形化的方式管理知识点和知识关系,无需复杂的知识编辑和维护;促进知识共享,通过构建的知识图谱可以共享给更多人,实现知识的广泛传播和应用;定制知识展示,具体通过交互操作,可以根据不同用户和场景,定制化展示知识图谱,提高知识的针对性。
具体在政府公关管理场景中,这种方法可以用于构建政府部门知识图谱,整合部门内的知识资源,促进知识共享;建设政府公共服务知识图谱,展示政府提供的各类公共服务及相关知识,提高公众对政府服务的理解;构建政府重点工作知识图谱,展示政府当前重点工作的知识框架和内容,帮助公众把握政府工作重点和进展;定制化展示政府工作知识图谱,根据不同群体的需求,提供定制化的知识入口,提高政府工作的透明度和接受度。
为便于对本实施例进行理解,首先对本申请实施例所公开的一种交互式低代码知识图谱的构建方法进行详细介绍。
请参考图1,其示出了本申请实施例提供的一种交互式低代码知识图谱的构建方法的流程图,该方法可以包括以下步骤:
步骤101,获取用户输入的知识点及其相关属性,根据知识点及其相关属性构建知识点图形表示。
在本申请实施例中,在获取用户输入的知识点及其相关属性之前,包括对原始数据进行预处理,具体地:
将采集到的原始数据进行数据去重、低质数据过滤、多样数据统一、模糊数据转换、噪声数据清洗,并转换为统一的格式;其中,原始数据可以包括文本、语音、图片等多种模态数据;对原始数据进行采集,当原始数据不符合处理预格式时,利用输入格式模板库中的模板调整为符合预处理格式的数据。
原始数据的数据源包括mysql、elk、hbase、es、csv文件数据源;也可包括CSV,JSON和XML,以及RESTAPI。还支持从ApacheSpark,Amazon Aurora和Oracle,PostgreSQL等流行的关系型数据库中导入数据。
具体地,本申请中支持接入文本(例如文章,报告,法律文书等)、图片、视频、音频、交互式输出以及众多参考数据,如百科词条,实时事件以及各种形式的地理数据。
在具体实现上,可以采用API、数据库直连、离线文件导入等多种方法进行数据导入,也可以通过在线数据的主动采集获取。也就是说,针对现在广泛使用的各种终端设备,例如服务器,手机客户端等等,采用常规的数据导入方式获取数据,从而实现简单的傻瓜式数据导入,不必针对数据接入单独设置装置或消耗人力。
针对不同种类的海量数据,通常具有文本、语音、图片等多种模态。为了有效地对多源知识进行统一表示,可以根据图像数据、文本数据等异构数据的知识表示技术。何将不同形式的知识(包括逻辑规则、文本、媒体数据、知识图谱等)进行embedding等表示和融合技术;探究了根据图像的亮度与阈值的对比度等特征,实现了基于卷积神经网络的多模态图像表示技术。
在数据中可能存在质量不合格的数据,为了提高数据分析知识图谱的准确性,以使最终能够支持数据分析可视化,在这里筛选融合数据中质量评估合格的数据,剔除掉质量评估不合格的数据。上述筛选过程可以由服务器直接基于预设筛选规则进行,还可以将融合数据推送至第三方专家平台或推送至专家,由第三方专家平台或专家基于专家经验数据进行筛选。具体来说,筛选是基于预设筛选规则进行的,预设筛选规则包括剔除融合数据中不满足映射关系的数据、剔除数据中的含有不被识别符号的数据、剔除数据中的值为空的数据、剔除融合数据中实体标识重复的数据以及剔除融合数据中实体之间关系矛盾的数据。
具体还可以根据预设筛选规则,筛选原始数据中质量评估合格的数据,预设筛选规则包括剔除原始数据中不满足映射关系的数据、剔除数据中的含有不被识别符号的数据、剔除数据中的值为空的数据、剔除原始数据中实体标识重复的数据以及剔除原始数据中实体之间关系矛盾的数据。
对于维基百科的结构化数据。维基百科的数据具有客观性、开放性和结构化的特点,适用于人物及通用知识图谱的建模。为了有效地从维基百科抽取数据进行知识图谱的建模研究,本申请基于维基百科数据的结构化特点,首先获取每个实体infobox所包含的结构化知识,通过实体清洗等技术,从中构建每个实体大类的一般模式,对每个实体所属类别进行建模。如图2,给出了本申请中知识图谱技术架构的具体示意图。
在本实施例中,在本申请中政府工作相关业务数据分为三大类:
行政管理数据:包括公文、政策文件、统计数据、政府报告等,用于支持政府决策制定。
财务管理数据:包括财务报表、财政收入、支出、财政预算等,用于管理政府财政收入和支出。
服务管理数据:包括政府服务项目、服务指标、服务满意度等,用于评估政府服务水平。
其中,数据具体包括人口数据,例如人口数量、人口结构、人口普查数据等;社会经济数据,例如国内生产总值、就业数据、物价数据等;资源数据,例如自然资源数据、能源数据、水资源数据等;环境数据,例如空气质量数据、水质数据、噪声数据等;公共服务数据,例如教育数据、卫生数据、公共交通数据等;安全数据,例如交通事故数据、灾害数据等;行政数据,例如行政区划数据、政策数据、行政数据等。
公共管理系统通常包括:系统、人力资源管理系统、行政审批系统、公文管理系统、信息公开系统、统计分析系统、督察督办系统、政务服务系统、电子政务系统等。
步骤102,将知识点图形表示布置在知识图谱空间内,形成初步知识图谱。
在本步骤中,从文本、数据库或其他数据源中提取关键的概念、实体和关系提取出知识点;将所提取的知识点表示为节点,将关系表示为边,进行图结构的构建;
使用图形布局算法(例如力导向布局和圆形布局)将知识图谱在二维或三维空间中进行可视化展示。
对于从文本、数据库或其他数据源中提取关键的概念可以是指将预处理后的数据进行结构化,对结构化数据进行知识融合,包括:获取预设开源工具;调用预设开源工具,将结构化数据转化为RDF三元组数据;归集、并融合RDF三元组数据,得到融合数据。
抽取好数据以后,可以进行知识融合。由于知识库属于关系型数据库,因此在知识融合时可以采用资源描述框架(RDF)作为数据模型。具体来说,可以采用开源工具把原来的关系数据库的数据一次性批量转化成RDF的三元组数据,该数据转换过程被称为RDB2RDF;也可以由人工抽取特定数据做成三元组数据人工输入知识库。经过融合后,实体概念中包含有多种类型三元数据,上述开源工具是预加的工具,其具体可以为Triplify,D2RServer,OpenLink Virtuoso,SparqlMap等。
步骤103,根据用户的拖拽、连接操作,在知识图谱空间内构建知识点之间的关联关系。
在本实施例中内置常见的基于图相关的深度学习归纳推理方法和基于逻辑或规则的演绎推理方法,并且内置NLP规则模型、词典、算法模型,帮助用户进一步分析、完善图谱的语义信息。支持图挖掘算法、社区挖掘算法等主流算法。支持扩展自定义的算法。
本申请中提供多种图形算法,包括PageRank用于发现图中的重要节点,最短路径算法用于快速查找任意两个节点之间的最短距离,以及关联规则学习和协同过滤算法用于挖掘隐式关联。这些算法可以应用于推荐系统、社交网络分析、安全威胁识别等场景。
另外,深度学习归纳推理方法是使用机器学习技术(如神经网络)从大量的数据中提取特征,并且根据这些特征来归纳出新的,未知的知识。逻辑或规则的演绎推理方法是使用一组定义好的规则,并根据这些规则来推导出新的,未知的知识。两种方法在构建知识图谱时能够互补,能够提供较为准确的结果。
深度学习归纳推理方法是根据已有的数据,从多项结论中选择最有可能的结论。比如,使用归纳推理方法,从一组已知的动物类别中推断出哪些动物可以在水中生活。这种方法需要系统地搜集大量数据,并用此数据来进行推理,从而得出一个最有可能的结论。
演绎推理是一种从一般性原则出发,通过联结和分析它们之间的关系来得出特定结论的推理方式。比如,如果有一条法律规定“所有青少年驾驶者都必须接受道路安全培训”,那么可以用该原则来推断出十五岁的孩子必须接受道路安全培训。
如图3给出了政策画像图谱示意图;图4给出了企业画像图谱示意图;图5给出了政策画像图谱与企业画像图谱进行信息关联后的示意图,具体地,政策画像图谱中的荣誉信息与行业分类与与企业画像图谱的产业类别与行业分类多重直接关联。
步骤104,根据用户的操作在知识图谱空间内添加、删除或修改知识点及其属性。
在本申请中数据的可视化是指将数据含义以一种图形、图像、视频、动画以及音频中的一种或多种组合起来进行呈现的方式,用来解决大量数据内容通过数据表呈现时难以解读和理解的问题。还包括动态可视化:使可视化数据随着输入数据的不同实时变化,通过动态获取数据实时展现数据的当前形态和变化。
通过API接口将构建完成的知识图谱在用户端进行可视化展示,并根据用户所调用的组件得到图谱分析结果,包括通过网页端HTML、移动端H5、数据API方式对外部系统提供服务及调用,供业务系统调用,满足各种通用场景;根据用户所调用的组件得到图谱分析结果,通过网页端HTML、移动端H5、数据API方式对外部系统提供服务及调用,供业务系统调用,满足各种通用场景;其中,还支持RESTfulAPI接口类型;还包括根据用户自定义实现配置数据、分配权限、和设置展现方式中的一种或多种功能。
还包括根据用户自定义实现配置数据、分配权限、和设置展现方式中的一种或多种功能;
其中,API接口至少包括:
AI通用服务接口,用于根据通用搜索请求实现语义搜索、智能推荐、专家建议以及其他服务功能;
AI开发服务接口,用于实现内容标签、偏好分析、数据托管以及模型托管功能;
AI定制服务接口,用于根据定制搜索请求实现定制化的语义搜索、智能推荐、专家建议以及其他服务功能。
如图6,给出了本实施例中知识图谱中各个API接口信息交互示意图。
支持交互式图谱查询与分析,不仅支持基于自然语言的检索与推荐,还支持基于图的模式发现功能,实现辅助用户从多维度分析图谱,支持图的展开、路径查找、图语言查询等图谱的操作,并为达到业务目标提供决策支持。可以通过配置节点样式,实体节点支持多种展示形式,支持通过BI形式对图分析页面中的实体进行分析,支持图谱下钻与折叠,支持批量操作图谱数据。
在本申请可选的实施例中,支持对接neo4j等各主流图数据库,实现图数据分散存储于集群中,可为用户提供实时图查询和离线算法分析,支持海量边点的分析和计算。通过交互式进行结构化数据并将其映射到知识图谱中;训练和测试知识图谱;发布和维护知识图谱;可视化知识图谱以改善搜索结果。
步骤105,根据用户的操作进一步迭代优化和完善知识图谱,形成交互式低代码知识图谱。
建立交互式界面,以使用户在交互式界面中进行浏览、搜索、编辑和添加知识点和关系;用户可以对知识图谱的准确性和完整性提供反馈,如纠错、补充信息等;根据用户的操作和反馈,实时更新知识图谱,优化布局和展示效果。
本申请实施例中还包括图任务的调度和管理、定制化功能,其中:
图任务的调度和管理支持自定义任务、任务管理等,并对任务进行调度,支持对任务的运行情况进行监控和维护。
定制化功能支持对接其他信创图数据库、用户权限系统和其他应用API接口,以实现权限校验和多种数据的分析与检索。
本申请的知识图谱针对于科创单位评价算法研究,算法内容主要包括以下:
采用实体对齐算法和知识补全算法,对知识图谱进行完善。从已构建的单位、产业链、供应链知识图谱中,挖掘单位市场核心地位、产品核心地位、单位发展潜力、技术领先性等,设计产业链地位、行业市场容量指标体系。
采用自然语言处理和机器学习等技术,建立单位科创属性评价模型。基于政策文件内容和招股书内容,进行相似度匹配和相似点挖掘;基于专利和论文等知识产权数据,设计并研发重要性判定模型,实现单位知识产权类数据重要性和主营业务相关性判定;基于知识产权、重大项目承接承建和研发投入等多源数据,整合生成统一的科创属性评价指标体系,进一步为目标单位提供评价。
采用低代码技术构建知识图谱,通过简单的拖拽、拼接等操作,政府公关人员可以快速构建和更新知识图谱,不需要复杂的编程。这可以提高知识图谱的构建和更新效率。
实现知识图谱的交互式展示。通过添加注释、链接等,可以实现知识图谱内部及与外部信息的交互连接,形成一个丰富的知识网络。这可以增强知识图谱的可用性和参考价值。
支持知识图谱的定制化展示。可以根据不同的用户需求,定制展示知识图谱的结构、内容和样式,实现知识图谱的多样化应用。这有利于扩展知识图谱的使用场景。
具有知识图谱的版本管理和差异比较功能。可以管理知识图谱的不同版本,并比较版本间的差异,有效控制知识图谱的变化,保证知识图谱的稳定性。
在政府公关管理中,这种交互式低代码知识图谱可以用于快速构建和更新政府部门的组织机构图谱、职能图谱等;建设政府信息资源的知识图谱,实现信息资源的高效管理和共享;构建政府工作流程的知识图谱,提高工作流程的透明度和标准化程度;构建政府政策法规的知识图谱,方便政府部门对政策法规的查询、理解和运用;构建政府公关活动的知识图谱,有效管理政府公关活动的计划、实施和评估。
在本申请可选的实施例中,在得到交互式低代码知识图谱的构建结果后还包括对交互式低代码知识图谱的构建结果进行结果展示。具体地,其过程包括:
S1,获取展示需求信息。
本实施例中,展示需求信息根据用户检索需求确定。具体的,展示需求信息包括关键词颜色,预设属性提取信息;本实施例中对此仅作示意性说明,不以此为限,在实际应用中根据需要合理设置即可。
其中,关键词即为用户输入的检索关键词;预设属性是重点属性,重点属性则属于业务系统的业务特色,比如在舆情行业,信息发布时间、作者人物画像、信息转发链等都属于重点属性,业务系统根据自己的业务特色对信息进行加工处理。
关键词(突发词)抽取:通过计算词频在当前时间窗口内的出现频率,与词频计算步骤得到的词频与全局出现频率进行比对,计算其本身词频突发性。结合当前时间段内每个子时间窗口内的词频突发性,使用该词的推文数量、转推数量、哈希标签数量综合考虑,得到子时间窗口内的关键词权重,按各子时间窗口的推文数量加权求和得到时间窗口内的关键词权重,取当前时间窗口内候选词组数量的平方根个关键词权重最高的作为当前窗口内的关键词。
S2,根据展示需求信息对交互式低代码知识图谱的构建结果进行标识,得到标识后的交互式低代码知识图谱的构建结果。
具体的,根据展示需求信息对交互式低代码知识图谱的构建结果进行相应的标识,例如,展示需求信息中关键词颜色设置为红色,则将交互式低代码知识图谱的构建结果中的关键词进行标红。
S3,将标识后的交互式低代码知识图谱的构建结果进行展示。
具体的,将标识后的交互式低代码知识图谱的构建结果展示给用户,用户便可以更加直观的看到交互式低代码知识图谱的构建结果。
上述步骤,根据展示需求信息对交互式低代码知识图谱的构建结果进行标识,并将标识后的交互式低代码知识图谱的构建结果进行展示,使得交互式低代码知识图谱的构建结果更加直观。
基于JavaScript的前端数据可视化模块,从而能够为使用者提供更为简洁明了的事件信息与图谱展示。可视化模块采用基于Flask和Flask的前后端分离架构。图部分采用E-charts进行可视化,来提供更好的交互功能与使用体验。可视化系统提供了三个页面:主页面,事件分析子页面,图谱展示子页面。
在进行信息展示时,还包括对用户的信息鉴别,具体地:
提供专用的登录控制模块对登录用户进行身份标识和鉴别;
对同一用户采用两种或两种以上组合的鉴别技术实现用户身份鉴别;
提供用户身份标识唯一和鉴别信息复杂度检查功能,保证应用系统中不存在重复用户身份标识,身份鉴别信息不易被冒用;
提供登录失败处理功能,可采取结束会话、限制非法登录次数和自动退出等措施;
启用身份鉴别、用户身份标识唯一性检查、用户身份鉴别信息复杂度检查以及登录失败处理功能,并根据安全策略配置相关参数。
请参考图7,其示出了本申请实施例提供的一种交互式低代码知识图谱的构建装置的框图。如图7所示,该装置可以包括:
输入模块,获取用户输入的知识点及其相关属性,根据知识点及其相关属性构建知识点图形表示;
布置模块,用于将知识点图形表示布置在知识图谱空间内,形成初步知识图谱;
关联关系构建模块,用于根据用户的拖拽、连接操作,在知识图谱空间内构建知识点之间的关联关系;
知识图谱优化模块,用于根据用户的操作,在知识图谱空间内添加、删除或修改知识点及其属性;
知识图谱形成模块,用于通过用户的操作,迭代优化和完善知识图谱,形成交互式低代码知识图谱。
关于交互式低代码知识图谱的构建装置的具体限定可以参见上文中对于交互式低代码知识图谱的构建方法的限定,在此不再赘述。上述交互式低代码知识图谱的构建装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种电子设备,该电子设备可以是计算机,其内部结构图可以如图8所示。该电子设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该设备的处理器用于提供计算和控制能力。该设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于交互式低代码知识图谱的构建数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种交互式低代码知识图谱的构建方法。
本领域技术人员可以理解,如图8中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在本申请的一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述交互式低代码知识图谱的构建方法的步骤。
本实施例提供的计算机可读存储介质,其实现原理和技术效果与上述方法实施例类似,在此不再赘述。
在本领域中,实现上述实施例方法的全部或部分流程可以通过计算机程序来指令相关的硬件来完成。所述的计算机程序可以存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可以包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM以多种形式存在,例如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双数据率SDRAM(DDRSDRAM)、增强型SDRAM(ESDRAM)、同步链路DRAM(SLDRAM)、存储器总线直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)以及存储器总线动态RAM(RDRAM)等。这些技术和设备都可以用于实现本申请所述的各种实施例方法,以提高计算机程序的执行效率和稳定性。
以上所述实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请专利的保护范围应以所附权利要求为准。
Claims (10)
1.一种交互式低代码知识图谱的构建方法,其特征在于,所述方法包括:
获取用户输入的知识点及其相关属性,根据知识点及其相关属性构建知识点图形表示;
将知识点图形表示布置在知识图谱空间内,形成初步知识图谱;
根据用户的拖拽、连接操作,在知识图谱空间内构建知识点之间的关联关系;根据用户的操作在知识图谱空间内添加、删除或修改知识点及其属性;并进一步迭代优化和完善知识图谱,形成交互式低代码知识图谱。
2.根据权利要求1所述的交互式低代码知识图谱的构建方法,其特征在于,在获取用户输入的知识点及其相关属性之前,包括对原始数据进行预处理,具体包括:
将采集到的原始数据进行数据去重、低质数据过滤、多样数据统一、模糊数据转换、噪声数据清洗,并转换为统一的格式;其中,所述原始数据可以包括文本、语音、图片等多种模态数据;所述原始数据的数据源包括mysql、elk、hbase、es、csv文件数据源;
对原始数据进行采集,当原始数据不符合处理预格式时,利用输入格式模板库中的模板调整为符合预处理格式的数据。
3.根据权利要求2所述的交互式低代码知识图谱的构建方法,其特征在于,对原始数据进行预处理,还包括:
根据预设筛选规则,筛选原始数据中质量评估合格的数据,预设筛选规则包括剔除原始数据中不满足映射关系的数据、剔除数据中的含有不被识别符号的数据、剔除数据中的值为空的数据、剔除原始数据中实体标识重复的数据以及剔除原始数据中实体之间关系矛盾的数据。
4.根据权利要求1所述的交互式低代码知识图谱的构建方法,其特征在于,所述知识点图形表示布置在知识图谱空间内,形成初步知识图谱,包括:
从文本、数据库或其他数据源中提取关键的概念、实体和关系提取出知识点;将所提取的知识点表示为节点,将关系表示为边,进行图结构的构建;
使用图形布局算法将知识图谱在二维或三维空间中进行可视化展示;其中,所述图形布局算法至少包括力导向布局和圆形布局。
5.根据权利要求4所述的交互式低代码知识图谱的构建方法,其特征在于,使用图形布局算法将知识图谱在二维或三维空间中进行可视化展示,还包括:
通过API接口将构建完成的知识图谱在用户端进行可视化展示,并根据用户所调用的组件得到图谱分析结果,包括:
通过网页端HTML、移动端H5、数据API方式对外部系统提供服务及调用,供业务系统调用,满足各种通用场景;其中,还支持RESTfulAPI接口类型;
还包括根据用户自定义实现配置数据、分配权限、和设置展现方式中的一种或多种功能;
其中,所述API接口至少包括:
AI通用服务接口,用于根据通用搜索请求实现语义搜索、智能推荐、专家建议以及其他服务功能;
AI开发服务接口,用于实现内容标签、偏好分析、数据托管以及模型托管功能;
AI定制服务接口,用于根据定制搜索请求实现定制化的语义搜索、智能推荐、专家建议以及其他服务功能。
6.根据权利要求1所述的交互式低代码知识图谱的构建方法,其特征在于,根据用户的操作不断优化和完善知识图谱,包括:
建立交互式界面,以使用户在所述交互式界面中进行浏览、搜索、编辑和添加知识点和关系;用户可以对知识图谱的准确性和完整性提供反馈,如纠错、补充信息等;根据用户的操作和反馈,实时更新知识图谱,优化布局和展示效果。
7.根据权利要求1所述的交互式低代码知识图谱的构建方法,其特征在于,将知识点图形表示布置在知识图谱空间内,形成初步知识图谱,具体包括:
基于图相关的深度学习归纳推理方法和基于逻辑或规则的演绎推理方法构建知识图谱,通过内置NLP规则模型、词典、算法模型完善图谱的语义信息。
8.一种交互式低代码知识图谱的构建装置,其特征在于,所述装置包括:
输入模块,获取用户输入的知识点及其相关属性,根据知识点及其相关属性构建知识点图形表示;
布置模块,用于将知识点图形表示布置在知识图谱空间内,形成初步知识图谱;
关联关系构建模块,用于根据用户的拖拽、连接操作,在知识图谱空间内构建知识点之间的关联关系;
知识图谱优化模块,用于根据用户的操作,在知识图谱空间内添加、删除或修改知识点及其属性;
知识图谱形成模块,用于通过用户的操作,迭代优化和完善知识图谱,形成交互式低代码知识图谱。
9.一种电子设备,其特征在于,包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7任一所述的交互式低代码知识图谱的构建方法。
10.一种计算机可读存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一所述的交互式低代码知识图谱的构建方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310557304.7A CN116595191A (zh) | 2023-05-17 | 2023-05-17 | 一种交互式低代码知识图谱的构建方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310557304.7A CN116595191A (zh) | 2023-05-17 | 2023-05-17 | 一种交互式低代码知识图谱的构建方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116595191A true CN116595191A (zh) | 2023-08-15 |
Family
ID=87595019
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310557304.7A Pending CN116595191A (zh) | 2023-05-17 | 2023-05-17 | 一种交互式低代码知识图谱的构建方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116595191A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117035081A (zh) * | 2023-10-09 | 2023-11-10 | 之江实验室 | 一种多元多模态知识图谱的构建方法及装置 |
CN118133944A (zh) * | 2023-12-21 | 2024-06-04 | 高等教育电子音像出版社有限公司 | 可视化知识图谱的节点控制方法、装置和电子设备 |
-
2023
- 2023-05-17 CN CN202310557304.7A patent/CN116595191A/zh active Pending
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117035081A (zh) * | 2023-10-09 | 2023-11-10 | 之江实验室 | 一种多元多模态知识图谱的构建方法及装置 |
CN117035081B (zh) * | 2023-10-09 | 2024-01-26 | 之江实验室 | 一种多元多模态知识图谱的构建方法及装置 |
CN118133944A (zh) * | 2023-12-21 | 2024-06-04 | 高等教育电子音像出版社有限公司 | 可视化知识图谱的节点控制方法、装置和电子设备 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wang et al. | Industrial big data analytics: challenges, methodologies, and applications | |
Chan et al. | The role of social media data in operations and production management | |
CN112307215B (zh) | 数据处理方法、装置及计算机可读存储介质 | |
Weber et al. | Coding the News: The role of computer code in filtering and distributing news | |
CN108874992A (zh) | 舆情分析方法、系统、计算机设备和存储介质 | |
CN116595191A (zh) | 一种交互式低代码知识图谱的构建方法及装置 | |
CN112036842B (zh) | 一种科技服务智能匹配装置 | |
Dragoni | A three-phase approach for exploiting opinion mining in computational advertising | |
CN109800354B (zh) | 一种基于区块链存储的简历修改意图识别方法及系统 | |
US10579734B2 (en) | Web-based influence system and method | |
KR102458510B1 (ko) | 실시간 보완 가능한 마케팅 시스템 | |
Theocharis et al. | Knowledge management systems in the public sector: Critical issues | |
Kinawy et al. | Customizing information delivery to project stakeholders in the smart city | |
Bildosola et al. | An approach for modelling and forecasting research activity related to an emerging technology | |
Bellatreche et al. | The central role of data repositories and data models in Data Science and Advanced Analytics | |
Enríquez-Reyes et al. | Systematic mapping of open data studies: Classification and trends from a technological perspective | |
CN111897947A (zh) | 一种基于开源信息的数据分析处理方法及装置 | |
CN117236624A (zh) | 一种基于动态图的Issue修复者推荐方法与装置 | |
CN117033654A (zh) | 一种面向科技迷雾识别的科技事件图谱构建方法 | |
Kozlova et al. | Development of the toolkit to process the internet memes meant for the modeling, analysis, monitoring and management of social processes | |
Naik et al. | An adaptable scheme to enhance the sentiment classification of Telugu language | |
Dadkhah et al. | What do websites say about internet of things challenges? A text mining approach | |
Mikheyenkova | Cognitive knowledge discovery in social sciences | |
Katz et al. | Data system design alters meaning in ecological data: Salmon habitat restoration across the US Pacific Northwest | |
Hsu et al. | Similarity search over personal process description graph |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |