CN113238865A - 基于Excel一键导入的快速构建知识图谱的方法 - Google Patents

基于Excel一键导入的快速构建知识图谱的方法 Download PDF

Info

Publication number
CN113238865A
CN113238865A CN202110539987.4A CN202110539987A CN113238865A CN 113238865 A CN113238865 A CN 113238865A CN 202110539987 A CN202110539987 A CN 202110539987A CN 113238865 A CN113238865 A CN 113238865A
Authority
CN
China
Prior art keywords
data
excel
entity
deleted
processing
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110539987.4A
Other languages
English (en)
Inventor
苏明
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Individual
Original Assignee
Individual
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Individual filed Critical Individual
Priority to CN202110539987.4A priority Critical patent/CN113238865A/zh
Publication of CN113238865A publication Critical patent/CN113238865A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F9/00Arrangements for program control, e.g. control units
    • G06F9/06Arrangements for program control, e.g. control units using stored programs, i.e. using an internal store of processing equipment to receive or retain programs
    • G06F9/46Multiprogramming arrangements
    • G06F9/50Allocation of resources, e.g. of the central processing unit [CPU]
    • G06F9/5005Allocation of resources, e.g. of the central processing unit [CPU] to service a request
    • G06F9/5027Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals
    • G06F9/5038Allocation of resources, e.g. of the central processing unit [CPU] to service a request the resource being a machine, e.g. CPUs, Servers, Terminals considering the execution order of a plurality of tasks, e.g. taking priority or time dependency constraints into consideration
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/36Creation of semantic tools, e.g. ontology or thesauri
    • G06F16/367Ontology
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/10Text processing
    • G06F40/166Editing, e.g. inserting or deleting
    • G06F40/174Form filling; Merging

Abstract

本发明公开了基于Exce l一键导入的快速构建知识图谱的方法,包括以下步骤:S1.分别创建新的实体表和关系表;S2.获取客户word结果集表;S3.采用PO I技术对S2中的Exce l表格数据进行相应的预处理;S4.可视化配置文件的编写;S5.可视化配置文件的校验;S6.Exce l表格数据解析;S7.数据验证;S8.exce l数据提交。经过层层的处理校验,把智能处理后的exce l表格数据提交到相应的处理平台,采用了分布式多线程的处理方式,能够对万级的数据量,能够在数秒内完成,响应时间快,从而能够节省用户大量的时间,此外该方法在使用过程中,人工干预较小,从而能够节省大量的人力,而且结果精度较高,加速了项目可执行性,满足了企业的需求。

Description

基于Excel一键导入的快速构建知识图谱的方法
技术领域
本发明属于科技信息管理技术领域,具体涉及基于Excel一键导入的快 速构建知识图谱的方法。
背景技术
随着互联网的发展,网络数据内容呈现爆炸式增长的态势。由于互联网 内容的大规模、异质多元、组织结构松散的特点,给人们有效获取信息和知 识提出了挑战。知识图谱(Knowledge Graph)以其强大的语义处理能力和开 放组织能力,为互联网时代的知识化组织和智能应用奠定了基础,当今企业 信息化和平台化程度越来越高,很多企业已经实施了各种各样的知识管理平 台,知识图谱对于企业来说其实只是一个工具,关键是要让知识获取、知识 建模、知识管理来匹配知识应用,最终还是要能满足具体的业务需求。对于 企业来讲,应用知识图谱的门槛在于如何高效构建知识图谱并实现可扩展可 更新,或者说需要有一个相对通用的框架,帮助企业快速地发挥业务数据的 价值。目前企业建立知识平台至少有以下几个显著问题:
(1)见效周期慢:一般知识管理平台通常前期要求大量的专家投入, 还要做大量的知识分类、数据治理、主数据等基础性工作。
(2)重点有偏差:一般知识管理平台重点通常放在了结构化数据上, 对非结构化数据关注的比较少。
(3)应用范围窄:一般知识管理平台提供知识检索的手段比较窄, 不能和业务系统深度结合,积累的知识对于研制过程没有发挥价值。
(4)技能要求高:无论是准备知识,还是治理数据等都要求参与人 员非常懂业务和IT技术。
所以在先进人工智能技术上打造的面向高端制造业的新一代专业知识服 务平台迫在眉睫。
现有的知识图谱平台综合运用了自然语言理解、知识抽取、机器学习、 知识图谱以及智能问答等人工智能技术,可以快速抽取企业现有的多源异构 的知识资产,通过机器学习训练,将现有业务系统中的相关数据以知识图谱、 智能索引等形式构建,并提供智能搜索、问答形式,帮助用户精准快速找到 知识资产,也可以集成到各类业务系统,赋于业务系统智能化,发挥其数据 价值。
但是,目前客户的数据是存放在word文档的表格中的,该表格的信息包 括表头以及数据,这些数据信息是通过客户系统的数据库多表查询导出来的 一张结果集表,此表表头不固定,表中包含的实体数量以及属性也不固定等 多种复杂结构形式,并且客户数据往往存在着“实体”、“属性”、“关系” 等数据都存在同一个表中,这样就需要人工手动的将客户的数据表拆解成符 合图谱构建平台的excel导入模板,导致了图谱构建的难度系数增大,效率 也不高。
如何快速构建一种把客户复杂的Excel文档通过处理,解析出文档中包 含的实体、属性、关系等数据的智能化处理方式迫在眉睫,这种智能化处理 方法通过系统内部处理,将客户数据分别存储到图数据库中,形成知识图谱, 以供图谱应用提供支撑。
发明内容
本发明的目的在于提供基于Excel一键导入的快速构建知识图谱的方法 及其使用方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明采用了如下技术方案:
于Excel一键导入的快速构建知识图谱的方法,包括以下步骤:
S1.分别创建新的实体表和关系表,按项目的实际需求,将相关的字段名 与字段类型等信息填入实体表和关系表中,后续经过智能处理后的Excel表 中的数据提交后会存入对应的实体表和关系表中;
S2.获取客户word结果集表,把word结果集表中的所有表格数据提取到 新创建的excel表中;
S3.采用POI技术对S2中的Excel表格数据进行相应的预处理,预处理 包括:归并Excel多个行列头、多sheet表单的同步处理、文件格式正确与 否的检测等;
S4.可视化配置文件的编写,可视化配置的主要的操作有:配置表头与实 体的映射关系、配置实体与实体的映射关系、配置实体的唯一约束信息等;
S5.可视化配置文件的校验,检测配置文件是否符合xsd格式要求,配置 文件汇总出现的表头是否存在,数据类型的校验;
S6.Excel表格数据解析,主要有实体解析、关系解析;
S7.数据验证,主要针对S6表格数据解析后的数据,再次进行灵活性检 测及修正,主要内容包括:可查看数据、数据可以编辑,可以删除实体所有 数据,可以删除某一列,也可以删除关系、删除实体时,相关联的关系数据 也会删除、对重复数据选择处理策略,覆盖或忽略;
S8.excel数据提交,经过层层的处理校验,把智能处理后的excel表格 数据提交到相应的处理平台。
优选的,所述S2包括以下步骤:
S21.所述word结果集表内容由三部分组成:第一部分是客户从本单位系 统中经过数据库查询获得的,第二部分是客户文档中现存的,第三部分是从 第三方库或其它途径获取数据并手动添加到所述word结果集表中的;
S22.创建excel表,把所述word结果集表中的所有表格数据提取到所述 excel表中,这些数据为待处理的原始数据;
S23.此处创建的所述excel表中最终存入的数据是经过智能处理后的待 提交的客户数据。
优选的,所述S3包括以下步骤:
S31.POI对Excel的单元格样式、标注脚注、设置打印、插入图片、超链 接等进行读写操作;
S32.此处excel表中的数据为原始数据,将其转换成满足平台要求的 excel导入模板;
S33.归并Excel多个行列头,经过该系统数据库的多表查询,以及自定 义选择“导出表头”字段进行归并,以便后续excel表格数据解析;
S34.多sheet表单的多线程处理;
S35.文件格式正确与否检测。
优选的,所述S6包括以下步骤:
S61.实体解析
根据字段属性的唯一约束,进行去重处理;
赋予唯一ID(查询Neo4j中的id,如果存在便使用,不存在就创建相应 的内容);
S62.关系解析
1)构建map1.key:实体约束字段组成的值拼接,多个字段中间通过-连 接,value为ID值;
2)构建map2,提取excel中的关系数据;
map2:from-->to,from为key,to为value,from,to的值为约束字 段组成的值拼接。
3)根据map1,将map2中的key与value转换成ID;
4)关系数据插入到数据库对应的表中。
优选的,所述S7包括以下内容:
1)查看数据、编辑数据;
2)可以删除实体所有数据,可以删除某一列,也可以删除关系;
3)删除实体时,相关联的关系数据也会删除;
4)对重复数据选择处理策略;
实体数据有两种:覆盖和忽略
关系数据有一种:忽略。
一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述 计算机程序被处理器执行时实现构建知识图谱的方法。
一种终端,包括:存储器和处理器,所述存储器中保存有计算机程序; 其中,处理器被配置为执行存储器中的计算机程序;所述计算机程序被所述 处理器执行时实现构建知识图谱的方法。
本发明的技术效果和优点:
采用了分布式多线程的处理方式,能够对万级的数据量,能够在数秒内 完成,响应时间快,从而能够节省用户大量的时间,此外该方法在使用过程 中,人工干预较小,从而能够节省大量的人力,而且结果精度较高,加速了 项目可执行性,满足了企业的需求。
附图说明
图1为本发明逻辑的框图;
具体实施方式
下面将结合本发明实施例中的附图1,对本发明实施例中的技术方案进行 清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而 不是全部的实施例。此处所描述的具体实施例仅仅用以解释本发明,并不用 于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创 造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例:
实施例:
如图1所示,本发明提供了基于Excel一键导入的快速构建知识图谱的方法,包括如下步骤:
S1.分别创建新的实体表和关系表,按项目的实际需求,将相关的字段名与字段类型等信息填入实体表和关系表中,后续经过智能处理后的Excel表中的数据提交后会存入对应的实体表和关系表中。
S2.获取客户word结果集表,把word结果集表中的所有表格数据提取到 新创建的excel表中;
S21.此word结果集表内容大概有三部分组成:第一部分是客户从本单位 系统中经过数据库查询获得的,第二部分是客户文档中现存的,第三部分是 从第三方库或其它途径获取数据并手动添加到word结果集表中的。
S22创建excel表,把word结果集表中的所有表格数据提取到此excel 表中,这些数据是待处理的原始数据。
S23此处创建的这个excel表中最终存入的是终经过智能处理后的待提交 的客户数据。
S3.采用POI技术,对S2中的Excel表格数据进行相应的预处理,预处 理包括:归并Excel多个行列头、多sheet表单的同步处理、文件格式正确 与否的检测;
S31.POI对Excel的读写操作功能十分强大,涉及到单元格样式、标注脚 注、设置打印、插入图片、超链接等,基本满足业务的所有需求。
S32.由于此处excel表中的数据是原始数据,需要经过加工处理,转换 成能满足平台要求的excel导入模板。
S33.归并Excel多个行列头,由于s21中word结果集表格中的表头以及 数据是通过客户自己的系统,经过该系统数据库的多表查询,以及自定义选 择“导出表头”字段,所以要把多个行列的表头进行归并,以便后续excel 表格数据解析。
S34.多sheet表单的多线程处理,加快表格的处理速度,提高执行效率。
S35.文件格式正确与否的检测,因为excel扩展名有xls、xlxs,本发明 中excel格式采用的是xlxs,xlsx的核心结构是XML类型的结构,采用基 于XML的压缩方式,使其占用的空间更小,因此要对Excel表格格式进行判 断检测。
S4.可视化配置文件的编写,此种可视化方式更具有通用性,以适应不同 的用户快速使用。可视化配置的主要的操作有:配置表头与实体的映射关系、 配置实体与实体的映射关系、配置实体的唯一约束信息。
S5.可视化配置文件的校验,主要检测配置文件是否符合XSD格式要求、 配置文件汇总出现的表头是否存在、数据类型的校验等。
XSD是指XML结构定义,XML Schema描述了XML文档的结构。本发明中 用一个指定的XML Schema来验证相应的XML文档,以检查该XML文档是否符 合其要求。
根据S1中创建的实体表和关系表中的相应字段的属性,检测配置文件汇 总出现的表头是否存在(如:人为的错误填写、乱写等)、数据类型是否正 确,通过层层的校验,严把质量关。
S6.Excel表格数据解析,主要有实体解析、关系解析;
S61.实体解析
根据字段属性的唯一约束,进行去重处理;
赋予唯一ID(查询Neo4j中的id,如果存在便使用,不存在就创建相应 的内容),Neo4j是一个高性能的NOSQL图形数据库,它将结构化数据存储在 网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性 的Java持久化引擎,Neo4j也可以被看作是一个高性能的图引擎,该引擎具 有成熟数据库的所有特性;
S62.关系解析
1)构建map1.key:实体约束字段组成的值拼接,多个字段中间通过-连 接,value为ID值;
2)构建map2,提取excel中的关系数据;
map2:from-->to,from为key,to为value,from,to的值为约束字 段组成的值拼接。
3)根据map1,将map2中的key与value转换成ID;
4)关系数据插入到数据库对应的表中。
S7.数据验证,主要针对S6表格数据解析后的数据,再次进行灵活性检 测及修正,主要内容包括:可查看数据、数据可以编辑,、可以删除实体所 有数据,可以删除某一列,也可以删除关系、删除实体时,相关联的关系数 据也会删除、对重复数据选择处理策略,覆盖或忽略;
主要内容包括:
1)查看数据、编辑数据;
2)可以删除实体所有数据,可以删除某一列,也可以删除关系;
3)删除实体时,相关联的关系数据也会删除;
4)对重复数据选择处理策略;
实体数据有两种:覆盖和忽略
关系数据有一种:忽略
(如:针对实体数据,重复的数据有两种处理策略,一个是覆盖,一个 是忽略,默认是忽略)。
S8.excel数据提交,经过层层的处理校验,此步把智能处理后的excel 表格数据提交到相应的处理平台,数据提交的主要操作有:
1)需要创建的数据提交到Neo4j
2)需要覆盖的数据提交到Neo4j
3)关系数据存在则直接忽略
4)统计提交的数据量
数据提交后,会存储到S1创建的图数据库相应实体表和关系表中。
本发明通过从客户的word文档中提取表格数据,把客户复杂的Excel文 档通过智能化处理,解析出文档中包含的实体、属性、关系等数据,然后再 通过系统内部处理,将该数据存储到图数据库当中,形成知识图谱,以供图 谱应用提供支撑,本发明在已有知识图谱平台功能的基础上,通过最大程度 稳定可靠的Excel一键导入数据功能,加速了项目可执行性,此快速导入方 式简单,导入快捷。
一种计算机存储介质,计算机存储介质中存储有计算机程序,计算机程 序被处理器执行时实现构建知识图谱的方法。
一种终端,包括:存储器和处理器,存储器中保存有计算机程序;其中, 处理器被配置为执行存储器中的计算机程序;计算机程序被处理器执行时实 现构建知识图谱的方法。
最后应说明的是:以上仅为本发明的优选实施例而已,并不用于限制本 发明,尽管参照前述实施例对本发明进行了详细的说明,对于本领域的技术 人员来说,其依然可以对前述各实施例所记载的技术方案进行修改,或者对 其中部分技术特征进行等同替换,凡在本发明的精神和原则之内,所作的任 何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (7)

1.基于Excel一键导入的快速构建知识图谱的方法,其特征在于,包括以下步骤:
S1.分别创建新的实体表和关系表,按项目的实际需求,将相关的字段名与字段类型等信息填入实体表和关系表中,后续经过智能处理后的Excel表中的数据提交后会存入对应的实体表和关系表中;
S2.获取客户word结果集表,把word结果集表中的所有表格数据提取到新创建的excel表中;
S3.采用POI技术对S2中的Excel表格数据进行相应的预处理,预处理包括:归并Excel多个行列头、多sheet表单的同步处理、文件格式正确与否的检测等;
S4.可视化配置文件的编写,可视化配置的主要的操作有:配置表头与实体的映射关系、配置实体与实体的映射关系、配置实体的唯一约束信息等;
S5.可视化配置文件的校验,检测配置文件是否符合xsd格式要求,配置文件汇总出现的表头是否存在,数据类型的校验;
S6.Excel表格数据解析,主要有实体解析、关系解析;
S7.数据验证,主要针对S6表格数据解析后的数据,再次进行灵活性检测及修正,主要内容包括:可查看数据、数据可以编辑,可以删除实体所有数据,可以删除某一列,也可以删除关系、删除实体时,相关联的关系数据也会删除、对重复数据选择处理策略,覆盖或忽略;
S8.excel数据提交,经过层层的处理校验,把智能处理后的excel表格数据提交到相应的处理平台。
2.根据权利要求1所述的基于Excel一键导入的快速构建知识图谱的方法,其特征在于:所述S2包括以下步骤:
S21.所述word结果集表内容由三部分组成:第一部分是客户从本单位系统中经过数据库查询获得的,第二部分是客户文档中现存的,第三部分是从第三方库或其它途径获取数据并手动添加到所述word结果集表中的;
S22.创建excel表,把所述word结果集表中的所有表格数据提取到所述excel表中,这些数据为待处理的原始数据;
S23.此处创建的所述excel表中最终存入的数据是经过智能处理后的待提交的客户数据。
3.根据权利要求1所述的基于Excel一键导入的快速构建知识图谱的方法,其特征在于:所述S3包括以下步骤:
S31.POI对Excel的单元格样式、标注脚注、设置打印、插入图片、超链接等进行读写操作;
S32.此处excel表中的数据为原始数据,将其转换成满足平台要求的excel导入模板;
S33.归并Excel多个行列头,经过该系统数据库的多表查询,以及自定义选择“导出表头”字段进行归并,以便后续excel表格数据解析;
S34.多sheet表单的多线程处理;
S35.文件格式正确与否检测。
4.根据权利要求1所述的基于Excel一键导入的快速构建知识图谱的方法,其特征在于:所述S6包括以下步骤:
S61.实体解析
根据字段属性的唯一约束,进行去重处理;
赋予唯一ID(查询Neo4j中的id,如果存在便使用,不存在就创建相应的内容);
S62.关系解析
1)构建map1.key:实体约束字段组成的值拼接,多个字段中间通过-连接,value为ID值;
2)构建map2,提取excel中的关系数据;
map2:from-->to,from为key,to为value,from,to的值为约束字段组成的值拼接。
3)根据map1,将map2中的key与value转换成ID;
4)关系数据插入到数据库对应的表中。
5.根据权利要求1所述的基于Excel一键导入的快速构建知识图谱的方法,其特征在于:所述S7包括以下内容:
1)查看数据、编辑数据;
2)可以删除实体所有数据,可以删除某一列,也可以删除关系;
3)删除实体时,相关联的关系数据也会删除;
4)对重复数据选择处理策略;
实体数据有两种:覆盖和忽略
关系数据有一种:忽略。
6.一种计算机存储介质,所述计算机存储介质中存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1~5中任一项所述的构建知识图谱的方法。
7.一种终端,包括:存储器和处理器,所述存储器中保存有计算机程序;其中,处理器被配置为执行存储器中的计算机程序;所述计算机程序被所述处理器执行时实现如执行权利要求1~5中任一项所述构建知识图谱的方法。
CN202110539987.4A 2021-05-18 2021-05-18 基于Excel一键导入的快速构建知识图谱的方法 Pending CN113238865A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110539987.4A CN113238865A (zh) 2021-05-18 2021-05-18 基于Excel一键导入的快速构建知识图谱的方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110539987.4A CN113238865A (zh) 2021-05-18 2021-05-18 基于Excel一键导入的快速构建知识图谱的方法

Publications (1)

Publication Number Publication Date
CN113238865A true CN113238865A (zh) 2021-08-10

Family

ID=77134950

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110539987.4A Pending CN113238865A (zh) 2021-05-18 2021-05-18 基于Excel一键导入的快速构建知识图谱的方法

Country Status (1)

Country Link
CN (1) CN113238865A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114372177A (zh) * 2022-03-22 2022-04-19 创意信息技术股份有限公司 一种Excel表格数据匹配方法
CN117194048A (zh) * 2023-04-13 2023-12-08 山东华科信息技术有限公司 用于业务数据的协同方法

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111813963A (zh) * 2020-09-10 2020-10-23 平安国际智慧城市科技股份有限公司 知识图谱构建方法、装置、电子设备及存储介质
CN112115271A (zh) * 2020-06-01 2020-12-22 泰康保险集团股份有限公司 知识图谱构建方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112115271A (zh) * 2020-06-01 2020-12-22 泰康保险集团股份有限公司 知识图谱构建方法及装置
CN111813963A (zh) * 2020-09-10 2020-10-23 平安国际智慧城市科技股份有限公司 知识图谱构建方法、装置、电子设备及存储介质

Non-Patent Citations (3)

* Cited by examiner, † Cited by third party
Title
SUNNY1009: "超级简单POI多sheet导出Excel实战", 《CNBLOGS》 *
YX0628: "Java使用POI操作Excel合并单元格", 《CSDN》 *
仇增辉: "基于网购评论的电商平台智能问答系统关键技术研究", 《信息科技辑》 *

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114372177A (zh) * 2022-03-22 2022-04-19 创意信息技术股份有限公司 一种Excel表格数据匹配方法
CN117194048A (zh) * 2023-04-13 2023-12-08 山东华科信息技术有限公司 用于业务数据的协同方法
CN117194048B (zh) * 2023-04-13 2024-04-09 山东华科信息技术有限公司 用于业务数据的协同方法

Similar Documents

Publication Publication Date Title
US8122066B2 (en) Database query profiler
US20110019915A1 (en) Methods and data structures for multiple combined improved searchable formatted documents including citation and corpus generation
US8959122B2 (en) Data processing device
US8433708B2 (en) Methods and data structures for improved searchable formatted documents including citation and corpus generation
CN104866593A (zh) 一种基于知识图谱的数据库搜索方法
US7516145B2 (en) System and method for incrementally transforming and rendering hierarchical data files
US7720885B2 (en) Generating a word-processing document from database content
CN107220274B (zh) 一种可视化数据接口集市实现方法
CN111309313A (zh) 一种快速生成html以及存储表单数据的方法
US20080114740A1 (en) System and method for maintaining conformance of electronic document structure with multiple, variant document structure models
CN113238865A (zh) 基于Excel一键导入的快速构建知识图谱的方法
US20110145005A1 (en) Method and system for automatic business content discovery
CN104899340A (zh) 一种基于最紧致片段的ietm技术信息片段检索装置及其检索方法
CN111026815B (zh) 基于用户辅助修正下的实体对特定关系抽取方法
US20180357328A1 (en) Functional equivalence of tuples and edges in graph databases
CN115203337A (zh) 一种数据库元数据关系知识图谱生成方法
US20070282804A1 (en) Apparatus and method for extracting database information from a report
US9405749B2 (en) Methods and data structures for improved searchable formatted documents including citation and corpus generation
CN111309930B (zh) 一种基于表示学习的医学知识图谱实体对齐方法
CN111914028A (zh) 一种基于图增量同步异构数据源数据关系的方法及装置
CN116521621A (zh) 一种数据处理方法、装置、电子设备及存储介质
US11816770B2 (en) System for ontological graph creation via a user interface
CN116010439A (zh) 一种可视化中文sql系统及构建查询方法
CN115827885A (zh) 一种运维知识图谱的构建方法、装置及电子设备
US20130290829A1 (en) Partition based structured document transformation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20210810