CN111078949A - 产品知识存储方法、装置、计算机设备和可读存储介质 - Google Patents

产品知识存储方法、装置、计算机设备和可读存储介质 Download PDF

Info

Publication number
CN111078949A
CN111078949A CN201911417583.7A CN201911417583A CN111078949A CN 111078949 A CN111078949 A CN 111078949A CN 201911417583 A CN201911417583 A CN 201911417583A CN 111078949 A CN111078949 A CN 111078949A
Authority
CN
China
Prior art keywords
data
target
semi
source file
attribute
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911417583.7A
Other languages
English (en)
Inventor
袁灿
于政
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Mininglamp Software System Co ltd
Original Assignee
Beijing Mininglamp Software System Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Mininglamp Software System Co ltd filed Critical Beijing Mininglamp Software System Co ltd
Priority to CN201911417583.7A priority Critical patent/CN111078949A/zh
Publication of CN111078949A publication Critical patent/CN111078949A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/80Information retrieval; Database structures therefor; File system structures therefor of semi-structured data, e.g. markup language structured data such as SGML, XML or HTML
    • G06F16/81Indexing, e.g. XML tags; Data structures therefor; Storage structures

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Software Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请实施例提供了一种产品知识存储方法、装置、计算机设备和可读存储介质,涉及数据存储技术领域,该方法包括:获取目标产品的源文件数据,解析所述源文件数据得到半结构化数据;解析所述半结构化数据得到目标知识数据;根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系;将所述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中,能够便捷地进行数据的存储。

Description

产品知识存储方法、装置、计算机设备和可读存储介质
技术领域
本申请涉及数据存储技术领域,具体而言,涉及一种产品知识存储方法、装置、计算机设备和可读存储介质。
背景技术
企业在其产品从研发、生产、销售以及售后所有环节中,较为关键的一个点即为产品相关知识,其贯穿一个公司大部分部门的工作场景。而产品相关知识,对于很多企业而言,存在于各种信息渠道,如相关产品的使用方法、维护和售后等信息可以通过产品手册、运维手册等电子或纸质书形式存储,通常很难获取,只能获取到部分非结构化文本。
有鉴于此,如何提供一种便捷的产品知识存储方案,是本领域技术人员需要解决的。
发明内容
本申请实施例提供了一种产品知识存储方法、装置、计算机设备和可读存储介质。
本申请的实施例可以这样实现:
第一方面,实施例提供一种产品知识存储方法,包括:
获取目标产品的源文件数据,并根据所述源文件数据获得源文件实体属性;
解析所述源文件数据得到半结构化数据,并根据所述半结构化数据获取半结构化数据实体属性;
解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性;
根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系;
将所述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中。
在可选的实施方式中,所述根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系的步骤,包括:
获取所述源文件数据和所述半结构化数据之间的第一关系链路;
获取所述半结构化数据和所述目标知识数据之间的第二关系链路;
根据所述第一关系链路和所述第二关系链路,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系。
在可选的实施方式中,所述目标知识数据包括文字知识数据和非文字知识数据;
所述解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性的步骤,包括:
当所述目标知识数据为文字知识数据时,根据命名实体识别获取所述目标知识数据属性;
当所述目标知识数据为非文字知识数据时,通过设置唯一标识获取所述目标知识数据属性。
在可选的实施方式中,所述预设对应数据库包括图数据库;
所述方法包括:
根据所述源文件实体属性、半结构化数据实体属性、目标知识数据属性和目标关联关系构建目标知识图谱;
将所述目标知识图谱存储至所述图数据库。
第二方面,实施例提供一种产品知识存储装置,包括:
获取模块,用于获取目标产品的源文件数据,并根据所述源文件数据获得源文件实体属性;
解析模块,用于解析所述源文件数据得到半结构化数据,并根据所述半结构化数据获取半结构化数据实体属性;解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性;
关联模块,用于根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系;
存储模块,用于将所述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中。
在可选的实施方式中,所述关联模块具体用于:
获取所述源文件数据和所述半结构化数据之间的第一关系链路;获取所述半结构化数据和所述目标知识数据之间的第二关系链路;根据所述第一关系链路和所述第二关系链路,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系。
在可选的实施方式中,所述目标知识数据包括文字知识数据和非文字知识数据;
所述解析模块具体用于:
当所述目标知识数据为文字知识数据时,根据命名实体识别获取所述目标知识数据属性;
当所述目标知识数据为非文字知识数据时,通过设置唯一标识获取所述目标知识数据属性。
在可选的实施方式中,所述预设对应数据库包括图数据库;
所述关联模块具体用于:
根据所述源文件实体属性、半结构化数据实体属性、目标知识数据属性和目标关联关系构建目标知识图谱;
将所述目标知识图谱存储至所述图数据库。
第三方面,实施例提供一种计算机设备,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行前述实施方式中任意一项所述的产品知识存储方法。
第四方面,实施例提供一种可读存储介质,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行前述实施方式中任意一项所述的产品知识存储方法。
本申请实施例的有益效果包括,例如:
采用本申请实施例提供的产品知识存储方法、装置、计算机设备和可读存储介质,通过获取目标产品的源文件数据,并根据所述源文件数据获得源文件实体属性;再解析所述源文件数据得到半结构化数据,并根据所述半结构化数据获取半结构化数据实体属性;进一步地解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性;然后根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系;最后将所述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中,能够便捷地进行产品知识存储。
附图说明
为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
图1为本申请实施例提供的产品知识存储方法的步骤流程示意图;
图2为本申请实施例提供的知识图谱的示意图;
图3为本申请实施例提供的产品知识存储装置的结构示意框图;
图4为本申请实施例提供的计算机设备的结构示意框图。
图标:100-计算机设备;110-产品知识存储装置;1101-获取模块;1102-解析模块;1103-关联模块;1104-存储模块;111-存储器;112-处理器;113-通信单元。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。
因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
在本申请的描述中,需要说明的是,若出现术语“上”、“下”、“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该申请产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。
此外,若出现术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
需要说明的是,在不冲突的情况下,本申请的实施例中的特征可以相互结合。
目前,产品从研发到生产,再到销售,再到售后,产品对应的产品知识是不同的。例如,在研发时,产品的产品知识主要为一些测试数据,而在生产时,产品的产品知识主要为一些产品尺寸数据,而在销售时,产品的产品知识主要为一些产品功能数据,而在售后时,产品的产品知识主要为一些操作数据。而各个不同的场景对应的用户(研发人员、生产人员、销售人员及客户),他们能够获取的产品相关知识是不同的,且不同产品的相关知识并不流通。而在售前的产品相关知识更多以电子文档形式存储,售后的产品相关知识又更多以产品手册、运维手册等纸质形式存储,相互之间难以互通,当一个用户需要获取产品的所有产品相关知识时,较为困难。不仅如此,若某个环节的产品相关知识需要更新,那么其他环节的对应部分更新较为困难,无法同步。基于此,本申请实施例提供了一种产品知识存储方法,如图1所示,该方法包括步骤S201至步骤S205。
步骤S201,获取目标产品的源文件数据,并根据所述源文件数据获得源文件实体属性。
在本申请实施例中,目标产品的源文件数据可以是数据库,Word文档,PDF文件,Excel表格等知识文件,可以根源文件数据的类型获取其实体属性。例如,源文件数据可以为关系数据库,对应的实体属性可以包括源数据库ip,源数据库端口,源数据库连接方式,源数据库用户名,源数据库密码等。又例如,源文件数据可以为关系数据库可以是Word文档,对应的实体属性可以包括文档名称、文档页数和文档大小等。
步骤S202,解析所述源文件数据得到半结构化数据,并根据所述半结构化数据获取半结构化数据实体属性。
可以从源文件数据中解析得到半结构化数据,半结构化数据可以是源文件数据的组成部分。例如,源文件数据可以是PDF文件,而通过解析该PDF文件,可以得到在所述PDF文件中的表格和文本,可以将该表格和文本作为该PDF解析得到的半结构化数据。可以进一步得到半结构化数据实体属性,例如,半结构化数据为PDF文件中的表格,可以获取表格的表名、表格在PDF文件中的页码、表格在PDF文件中的坐标、表格的存储路径作为半结构化数据实体属性。
步骤S203,解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性。
可以从半结构化数据中抽取得到目标知识数据。例如,半结构化数据可以是PDF文件中的表格,可以从中抽取得到一个工业轴承作为目标知识数据,对应的,工业轴承的目标知识数据属性可以为该工业轴承的产品名称、基本尺寸、载荷、保养方法等。
步骤S204,根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系。
可以获取源文件数据、半结构化数据和目标知识数据之间的关联关系,即各个数据之间的来源关系。例如,源文件数据为PDF文件,半结构化数据为存储在该PDF文件中的表格,目标知识数据为存储在该表格中的产品,可以得出,前述产品来自于前述表格,而前述表格又来自于前述PDF文件,可以将三者之间的来源关系作为源文件数据、半结构化数据和目标知识数据之间的关联关系。可以根据源文件数据、半结构化数据和目标知识数据之间的关联关系,获取对应的属性数据的目标关联关系。例如,目标知识数据属性为产品的基本尺寸,该目标知识数据属性对应的目标知识数据来源于一个表格,对应的,该目标知识数据属性来源该表格中的“产品信息”一栏,而该“产品信息”一栏即为该表格的半结构化数据,对应的,该表格又源于一个PDF文件中的“第四页”中,以上,便可以将产品的基本尺寸,“产品信息”一栏和“第四页”之间的关系作为目标关联关系。通过上述操作,能够将涉及的所有实体数据以及各个实体数据的属性关联起来,提高了后续处理数据的效率。
步骤S205,将所述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中。
在确定了源文件数据、半结构化数据和目标知识数据之间的关联关系以及源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系后,可以将源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中,以便后续查询时调用。
在前述基础上,本申请实施例提供一种根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系的示例,可以通过以下步骤实现。
获取所述源文件数据和所述半结构化数据之间的第一关系链路。
获取所述半结构化数据和所述目标知识数据之间的第二关系链路。
根据所述第一关系链路和所述第二关系链路,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系。
如前所述,源文件数据可以是PDF文件,对应的半结构化数据可以是该PDF文件中的表格,而对应的目标知识数据为该表格中的产品。可以将PDF文件和表格的关系作为第一关系链路,而将表格和产品的关系作为第二关系链路,而对应的源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系,便能够通过第一关系链路和第二关系链路更为清晰的表示。
在前述基础上,所述预设对应数据库包括图数据库。本申请实施例提供一种将源文件实体属性、半结构化数据实体属性、目标知识数据属性和目标关联关系存储至预设对应数据库中的示例,可以通过以下步骤实现。
根据所述源文件实体属性、半结构化数据实体属性、目标知识数据属性和目标关联关系构建目标知识图谱。
将所述目标知识图谱存储至所述图数据库。
可以将获取的源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中,以便后续使用。例如,可以根据前述获取的过第一关系链路、第二关系链路和源文件实体属性、半结构化数据实体属性、目标知识数据属性和目标关联关系构建目标知识图谱,如图2所示。再将上述数据构建成知识图谱后,可以将其存储至对应预设数据库中,即图数据库中,而涉及的图片和表格页面的位置信息都可以在关系数据中存储,以便用户后续使用。而对于其他数据,例如,源文件数据、半结构化数据、和目标知识数据中涉及的数据,也可以根据具体的数据类型将其存储至对应预设数据库中。例如,可以将源文件数据以及从源文件中解析得到的半结构化数据(例如表格、图片、文本等)导入文件系统中进行存储。而在将前述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性、目标关联关系以及其他涉及的数据分别存储至预设对应数据库中后,可以将涉及的多个预设对应数据库作为后续用户统一管理的产品知识库。无论用户处于研发、生产、销售和售后中的哪一个节点,都能准确快速地获取需求产品的所有信息以及所有信息之间的关系,能够提高用户处理事务的效率,也能保证更新数据时的同步性,有效避免了后续数据不对应的问题。
在前述基础上,所述目标知识数据包括文字知识数据和非文字知识数据。本申请实施例提供一种解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性的示例,可以通过以下步骤实现。
当所述目标知识数据为文字知识数据时,根据命名实体识别获取所述目标知识数据属性。
当所述目标知识数据为非文字知识数据时,通过设置唯一标识获取所述目标知识数据属性。
在进行数据存储即调用时时,若目标知识数据为文字知识数据时,可以通过命名实体识别(Named Entity Recongition,简称NER)来获取目标知识数据属性。若目标知识数据为非文字知识数据(例如,图片或表格)时,则可以通过设置唯一识别标识进行关联。除了目标知识数据属性,当半结构数据或者源文件数据为非文字知识数据时,也可以通过设置唯一识别标识的方式来进行关联、查找等操作。
本申请实施例提供一种产品知识存储装置110,如图3所示,包括:
获取模块1101,用于获取目标产品的源文件数据,并根据所述源文件数据获得源文件实体属性。
解析模块1102,用于解析所述源文件数据得到半结构化数据,并根据所述半结构化数据获取半结构化数据实体属性;解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性。
关联模块1103,用于根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系。
存储模块1104,用于将所述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中。
进一步地,所述关联模块1103具体用于:
获取所述源文件数据和所述半结构化数据之间的第一关系链路;获取所述半结构化数据和所述目标知识数据之间的第二关系链路;根据所述第一关系链路和所述第二关系链路,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系。
进一步地,所述目标知识数据包括文字知识数据和非文字知识数据;
所述解析模块1102具体用于:
当所述目标知识数据为文字知识数据时,根据命名实体识别获取所述目标知识数据属性;当所述目标知识数据为非文字知识数据时,通过设置唯一标识获取所述目标知识数据属性。
进一步地,所述预设对应数据库包括图数据库;所述关联模块1103具体用于:
根据所述源文件实体属性、半结构化数据实体属性、目标知识数据属性和目标关联关系构建目标知识图谱;将所述目标知识图谱存储至所述图数据库。
本申请实施例提供一种计算机设备100,所述计算机设备100包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备100执行前述的产品知识存储方法。如图4所示,图4为本申请实施例提供的计算机设备100的结构框图。所述计算机设备100包括产品知识存储装置110、存储器111、处理器112及通信单元113。
所述存储器111、处理器112以及通信单元113各元件相互之间直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件相互之间可通过一条或多条通讯总线或信号线实现电性连接。所述产品知识存储装置110包括至少一个可以软件或固件(firmware)的形式存储于所述存储器111中或固化在所述计算机设备100的操作系统(operatingsystem,OS)中的软件功能模块。所述处理器112用于执行所述存储器111中存储的可执行模块,例如所述产品知识存储装置110所包括的软件功能模块及计算机程序等。
其中,所述存储器111可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。
本申请实施例提供一种可读存储介质,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备100执行前述的产品知识存储方法。
综上所述,本申请实施例提供了一种产品知识存储方法、装置、计算机设备和可读存储介质,通过利用知识图谱来进行知识管理,融合关系数据库、文件系统以及知识图谱等存储形式,从而形成统一管理的产品知识库,能够有效关联工业场景的产品知识,改善了知识的难以查询的问题、便于用户进行管理和维护。
以上所述,仅为本申请的具体实施方式,但本申请的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本申请揭露的技术范围内,可轻易想到的变化或替换,都应涵盖在本申请的保护范围之内。因此,本申请的保护范围应以所述权利要求的保护范围为准。

Claims (10)

1.一种产品知识存储方法,其特征在于,包括:
获取目标产品的源文件数据,并根据所述源文件数据获得源文件实体属性;
解析所述源文件数据得到半结构化数据,并根据所述半结构化数据获取半结构化数据实体属性;
解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性;
根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系;
将所述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中。
2.根据权利要求1所述的方法,其特征在于,所述根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系的步骤,包括:
获取所述源文件数据和所述半结构化数据之间的第一关系链路;
获取所述半结构化数据和所述目标知识数据之间的第二关系链路;
根据所述第一关系链路和所述第二关系链路,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系。
3.根据权利要求1所述的方法,其特征在于,所述目标知识数据包括文字知识数据和非文字知识数据;
所述解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性的步骤,包括:
当所述目标知识数据为文字知识数据时,根据命名实体识别获取所述目标知识数据属性;
当所述目标知识数据为非文字知识数据时,通过设置唯一标识获取所述目标知识数据属性。
4.根据权利要求1所述的方法,其特征在于,所述预设对应数据库包括图数据库;
所述方法包括:
根据所述源文件实体属性、半结构化数据实体属性、目标知识数据属性和目标关联关系构建目标知识图谱;
将所述目标知识图谱存储至所述图数据库。
5.一种产品知识存储装置,其特征在于,包括:
获取模块,用于获取目标产品的源文件数据,并根据所述源文件数据获得源文件实体属性;
解析模块,用于解析所述源文件数据得到半结构化数据,并根据所述半结构化数据获取半结构化数据实体属性;解析所述半结构化数据得到目标知识数据,并根据所述目标知识数据获取目标知识数据属性;
关联模块,用于根据所述源文件数据、半结构化数据和目标知识数据之间的关联关系,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系;
存储模块,用于将所述源文件数据、源文件实体属性、半结构化数据、半结构化数据实体属性、目标知识数据、目标知识数据属性和目标关联关系存储至预设对应数据库中。
6.根据权利要求5所述的装置,其特征在于,所述关联模块具体用于:
获取所述源文件数据和所述半结构化数据之间的第一关系链路;获取所述半结构化数据和所述目标知识数据之间的第二关系链路;根据所述第一关系链路和所述第二关系链路,获取所述源文件实体属性、半结构化数据实体属性和目标知识数据属性之间的目标关联关系。
7.根据权利要求5所述的装置,其特征在于,所述目标知识数据包括文字知识数据和非文字知识数据;
所述解析模块具体用于:
当所述目标知识数据为文字知识数据时,根据命名实体识别获取所述目标知识数据属性;
当所述目标知识数据为非文字知识数据时,通过设置唯一标识获取所述目标知识数据属性。
8.根据权利要求5所述的装置,其特征在于,所述预设对应数据库包括图数据库;
所述关联模块具体用于:
根据所述源文件实体属性、半结构化数据实体属性、目标知识数据属性和目标关联关系构建目标知识图谱;
将所述目标知识图谱存储至所述图数据库。
9.一种计算机设备,其特征在于,所述计算机设备包括处理器及存储有计算机指令的非易失性存储器,所述计算机指令被所述处理器执行时,所述计算机设备执行权利要求1-4中任意一项所述的产品知识存储方法。
10.一种可读存储介质,其特征在于,所述可读存储介质包括计算机程序,所述计算机程序运行时控制所述可读存储介质所在计算机设备执行权利要求1-4中任意一项所述的产品知识存储方法。
CN201911417583.7A 2019-12-31 2019-12-31 产品知识存储方法、装置、计算机设备和可读存储介质 Pending CN111078949A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911417583.7A CN111078949A (zh) 2019-12-31 2019-12-31 产品知识存储方法、装置、计算机设备和可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911417583.7A CN111078949A (zh) 2019-12-31 2019-12-31 产品知识存储方法、装置、计算机设备和可读存储介质

Publications (1)

Publication Number Publication Date
CN111078949A true CN111078949A (zh) 2020-04-28

Family

ID=70321006

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911417583.7A Pending CN111078949A (zh) 2019-12-31 2019-12-31 产品知识存储方法、装置、计算机设备和可读存储介质

Country Status (1)

Country Link
CN (1) CN111078949A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113592448A (zh) * 2021-07-29 2021-11-02 上海明略人工智能(集团)有限公司 互联网产品档案管理方法、系统、电子设备及存储介质

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120284224A1 (en) * 2011-05-04 2012-11-08 Microsoft Corporation Build of website knowledge tables
CN108446368A (zh) * 2018-03-15 2018-08-24 湖南工业大学 一种包装产业大数据知识图谱的构建方法及设备
CN109597855A (zh) * 2018-11-29 2019-04-09 北京邮电大学 基于大数据驱动的领域知识图谱构建方法及系统
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN110377758A (zh) * 2019-07-17 2019-10-25 江南大学 一种基于知识图谱的招投标网页信息解析方法

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20120284224A1 (en) * 2011-05-04 2012-11-08 Microsoft Corporation Build of website knowledge tables
CN108446368A (zh) * 2018-03-15 2018-08-24 湖南工业大学 一种包装产业大数据知识图谱的构建方法及设备
CN109597855A (zh) * 2018-11-29 2019-04-09 北京邮电大学 基于大数据驱动的领域知识图谱构建方法及系统
CN110008288A (zh) * 2019-02-19 2019-07-12 武汉烽火技术服务有限公司 用于网络故障分析的知识图谱库的构建方法及其应用
CN110377758A (zh) * 2019-07-17 2019-10-25 江南大学 一种基于知识图谱的招投标网页信息解析方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113592448A (zh) * 2021-07-29 2021-11-02 上海明略人工智能(集团)有限公司 互联网产品档案管理方法、系统、电子设备及存储介质

Similar Documents

Publication Publication Date Title
CN109299446B (zh) 报告生成方法及装置
AU2017101864A4 (en) Method, device, server and storage apparatus of reviewing SQL
WO2017107853A1 (zh) 一种数据监控管理方法、数据监控方法及系统
CN108021598B (zh) 页面抽取模板匹配方法、装置及服务器
KR101505858B1 (ko) 대용량 데이터를 용이하게 분석하기 위하여 테이블 관계 및 참조의 템플릿을 검색하여 제공하는 템플릿 기반 온라인 분석보고서 작성 지원 시스템
CN110457346B (zh) 数据查询方法、装置及计算机可读存储介质
US20210319039A1 (en) Extraction of a nested hierarchical structure from text data in an unstructured version of a document
CN111552704A (zh) 一种数据报表生成方法、装置、计算机设备及存储介质
CN107870915A (zh) 对搜索结果的指示
CN111338693A (zh) 基于模型构建的目标文件生成方法、服务器及存储介质
CN111078949A (zh) 产品知识存储方法、装置、计算机设备和可读存储介质
CN109670092A (zh) Xml文档校对方法及装置
CN110489032B (zh) 用于电子书的词典查询方法及电子设备
CN111400289B (zh) 智能用户分类方法、服务器及存储介质
CN116127047B (zh) 企业信息库的建立方法与装置
CN114493159B (zh) 一种基于mes系统的节点位置校验方法和装置
JP2006023968A (ja) 固有表現抽出方法および装置並びにそれらに用いるプログラム
CN114817152A (zh) 切片文件的查询方法与系统
CN112612866B (zh) 知识库文本同步方法、装置、电子设备及存储介质
CN114637866A (zh) 数字化新媒体的信息管理方法及装置
CN110457021B (zh) 指标数据处理方法、装置及计算机可读存储介质
CN109299439B (zh) 数字提取方法和装置、存储介质及电子装置
CN112685304A (zh) 前端信息规范校验方法、系统、装置及存储介质
US11170164B2 (en) System and method for cell comparison between spreadsheets
EP3308296A1 (en) A method and system for locating regulatory information

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination