CN110019754A - 一种知识库的建立方法、装置及设备 - Google Patents

一种知识库的建立方法、装置及设备 Download PDF

Info

Publication number
CN110019754A
CN110019754A CN201910091609.7A CN201910091609A CN110019754A CN 110019754 A CN110019754 A CN 110019754A CN 201910091609 A CN201910091609 A CN 201910091609A CN 110019754 A CN110019754 A CN 110019754A
Authority
CN
China
Prior art keywords
knowledge
placeholder
templet
data
node data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910091609.7A
Other languages
English (en)
Other versions
CN110019754B (zh
Inventor
郭伟
陈红伟
侯仁鹏
王景晖
阎斌
张荣超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910091609.7A priority Critical patent/CN110019754B/zh
Publication of CN110019754A publication Critical patent/CN110019754A/zh
Application granted granted Critical
Publication of CN110019754B publication Critical patent/CN110019754B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3329Natural language query formulation or dialogue systems
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis

Abstract

本说明书提供了一种知识库的构建方法、装置及设备。根据各业务领域的特点预先创建知识模板,知识模板包括预置文本和至少一个占位符,并且定义了各占位符的属性,然后根据各占位符的属性从源数据中提取与占位符对应的节点数据,填充到占位符中,构建目标知识并存储到知识库中。通过这种方法,可以将知识结构化,且目标知识可以通过知识模板中的预置文本和占位符组成的自然语言来描述,易于理解,并且可以描述比较复杂的知识,构建成知识库后,方便知识的查询和应用。

Description

一种知识库的建立方法、装置及设备
技术领域
本发明涉及数据处理技术领域,尤其涉及一种知识库的建立方法、装置及设备。
背景技术
目前,很多知识都因为没有被结构化且存放零散,以致于很难被利用或者查看,比如说,大多数知识都存放在文档库、内部站点中代码里,代码注释里,预案或者限流的描述里,word/excel/ppt文件里,聊天记录里,邮件的某个回复里,由于知识没有被统一的管理起来,因而很难实现对知识的利用。另外,由于知识没有结构化,很多步骤型的知识也没法自动去执行,以实现更多功能。因此,如何将没有结构化,存放零散的一些高可用知识管理起来,以便利用这些知识为客户服务是一个备受关注的问题。知识库是一种非常有效的数据组织形式,被广泛地用于知识的管理与存储。因此,为了让高可用的知识利用知识库更有效的存储,需要对知识库的技术进行改进。
发明内容
为克服相关技术中存在的问题,本说明书提供了一种知识库的建立方法、装置及设备。
首先,本说明书提供了一种知识库建立的方法,所述方法包括:
从数据库中获取源数据;
根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据,其中,所述知识模板根据目标知识所属的业务领域预先创建,所述知识模板包括预置文本和至少一个占位符,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则;
将所述节点数据填充到所述知识模板的占位符中,以构建目标知识,所述目标知识通过所述预置文本和所述节点数据描述;
将所述目标知识存储到知识库中。
其次,本说明书提供了一种知识库的建立装置,包括:
获取模块,从数据库中获取源数据;
提取模块,根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据,其中,所述知识模板根据目标知识所属的业务领域预先创建,所述知识模板包括预置文本和至少一个占位符,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则;
填充模块,将所述节点数据填充到所述知识模板的占位符中,以构建目标知识,所述目标知识通过所述预置文本和所述节点数据描述;
存储模块,将所述目标知识存储到知识库中。
进一步,本说明书提供了一种设备,所述设备包括:
存储器,用于存储可执行的计算机指令;
处理器,用于执行所述计算机指令时实现以下步骤:
从数据库中获取源数据;
根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据,其中,所述知识模板根据目标知识所属的业务领域预先创建,所述知识模板包括预置文本和至少一个占位符,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则;
将所述节点数据填充到所述知识模板的占位符中,以构建目标知识,所述目标知识通过所述预置文本和所述节点数据描述;
将所述目标知识存储到知识库中。
本说明书的有益效果:根据各业务领域的特点预先创建知识模板,知识模板包括预置文本和占位符,占位符可以是一个或多个,并且定义了各占位符的属性,然后根据各占位符的属性从源数据中提取与占位符对应的节点数据,填充到占位符中,构建目标知识并存储到知识库中。通过这种方法,可以将知识结构化,且目标知识可以通过知识模板中的预置文本和占位符组成的自然语言来描述,易于理解,并且可以描述比较复杂的知识,构建成知识库后,方便知识的查询和应用。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本说明书。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本发明的实施例,并与说明书一起用于解释本发明的原理。
图1为本说明书一示例性实施例示出的一种知识图谱的示意图;
图2为本说明书一示例性实施例示出的一种知识库建立方法流程图;
图3a为本说明书一示例性实施例示出的一种知识模板的示意图;
图3b为本说明书一示例性实施例示出的一种知识模板的示意图;
图4a为本说明书一示例性实施例示出的存储知识模板中占位符的节点数据的数据表示意图;
图4b为本说明书一示例性实施例示出的一个知识配置表的示意图;
图5为本说明书一示例性实施例示出的一个知识配置表的示意图;
图6为本说明书一示例性实施例示出的一种知识库建立装置的逻辑框图;
图7为本说明书一示例性实施例示出的一种设备的结构逻辑框图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本发明相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本发明的一些方面相一致的装置和方法的例子。
在本发明使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
应当理解,尽管在本发明可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本发明范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。取决于语境,如在此所使用的词语“如果”可以被解释成为“在……时”或“当……时”或“响应于确定”。
目前,很多知识都因为没有被结构化且存放零散,以致于很难被利用或者查看,比如说,大多数知识都存放在文档库中,内部站点中、代码里,代码注释里,预案或者限流的描述里,word/excel/ppt文件里,聊天记录里,邮件的某个回复里,由于知识没有被统一的管理起来,因而很难实现对知识的利用。另外,由于知识没有结构化,步骤型的知识也难以自动执行。步骤型的知识应用很广泛,比如一个预案推送后,需要执行以下步骤:先巡检一下是否推送到了指定的机器,然后根据影响面通知到对应的钉钉群,让相关同学(如客满、安全等)等知晓,同时自动监控相关的业务监控,如果影响了成功率,就应该回滚,回滚了也应该通知到对应的钉钉群,最后综合推送后的监控、客诉情况,出一个推送报告。若果这些步骤型的知识形成结构化的知识后,开发人员便可以更好的去利用这些知识去自动实现很多功能。
如何将没有结构化,存放零散的一些高可用知识管理起来,以便利用这些知识为客户服务是一个备受关注的问题。知识库是一种非常有效的数据组织形式,被广泛地用于知识的管理与存储。知识图谱是目前常用的一种存储数据的方式,如图1所示,知识图谱以三元组来表示存储的内容,三元组的形式为(A,R,B),其中A和B表示实体,R表示关系,比如要表示罗纳尔多的国籍是巴西,知识图谱中用三元组是这样表示的,(罗纳尔多,国籍,巴西),三元组类似于主谓宾结构。但是,目前很多高可用的知识往往难以通过三元组的形式将其完整的表述出来。比如说,要表示在A场景下,B系统调用C系统的D接口去执行E功能,其中A场景、B系统、C系统、D接口、E功能一共有5个元组,所以单纯的采用三元组是没法用自然语言完整的描述这个知识点。
为了解决上述问题,本说明书提供了一种知识库的建立方法,可以根据各个特定的业务领域的特点创建一个知识模板,其中,知识模板包括了预置文本和一个或多个占位符,占位符中可以填充数据,预置文本和占位符中填充的数据结合起来即可以构成用自然语言描述的知识。知识模板中定义了各占位符的属性,通过程序可以自动的根据知识模板中占位符的属性从源数据库中提取与占位符对应的节点数据,填充到知识模板的占位符中,构成目标知识。通过这种方法可以将知识结构化,并且知识模板比较灵活,可以包含多个元组,并且以自然语言来描述知识,这样便可以描述各种复杂的知识,且构建知识库后,也方便了知识的查询和应用。
具体地,本说明书提供的知识库的建立方法如图2所示,包括步骤S202-S208:
S202、从数据库中获取源数据;
S204、根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据,其中,所述知识模板根据目标知识所属的业务领域预先创建,所述知识模板包括预置文本和至少一个占位符,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则;
S206、将所述节点数据填充到所述知识模板的占位符中,构建目标知识,所述目标知识通过所述预置文本和所述节点数据描述;
S208、将所述目标知识存储到知识库中。
本说明书中提供的知识库的建立方法可用于各个行业领域的知识库的构建。在构建知识库之前,可以根据各个业务领域的特点构建知识模板,所述知识模板包括预置文本和占位符,并且定义了各占位符的属性,占位符中可以填充节点数据,目标知识通过预置文本结合占位符中填充的节点数据描述。知识模板中的占位符可以是一个或者多个,根据所要构建的目标知识的特点具体确定。此外,预置文本和占位符中填充的节点数据可以组成自然语言,目标知识可以用自然语言表述出来,便于理解。举个例子,比如想构建一个知识库,方便了解在不同的场景下使用支付宝支付时,系统之间的调用情况,以及依赖关系,则可以预先创建一个如图3a所示的知识模板,“在scene下,推送value到drm(drm为统一配置中心的某个配置项),fromApp调toAPP的interface,会变为depends。”其中,“在”、“下、推送”、“到”、“会变为”都是预置文本,而“scene”、“value”、“drm”、“fromApp”、“toApp”、“interface”、“depends”即为占位符,这些占位符可以填充与其属性对应的节点数据,比如,“secne”这个占位符中填充的是各种场景数据,比如淘宝交易场景,当面付店铺码场景、当面付铁路二维码场景等这些可能涉及到的场景,而fromApp这个占位符则可以填充调用其他APP的各种APP的名称。再比如,如果要知道一个公司里面的员工关系,则可以构建一个如图3b所示的知识模板,“name是name的position”用来描述员工之间的关系,其中,“是”、“的”是预置文本,“name”、“position”则为占位符,可以在占位符填充相应的节点数据来构成知识,name这个占位符填充节点数据是人名,而position则填充职务,如“张三是李四的经理”,“王五是张三的HR”等等。总而言之,可以根据业务领域的特点去灵活的构建知识模板,设定模板中的预置文本和占位符,以及定义占位符的属性,让知识模板更好的去描述想要构建的知识。其中,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则,以便根据这些规则提取与占位符对应的节点数据。此外,占位符中填充的节点数据可以是实体、文本、数字、枚举等等,具体可以根据实际需求去设置。
在创建好知识模板后,程序可以从数据库中获取源数据,然后再根据知识模板中定义的各个占位符的属性,从源数据中提取与占位符对应的节点数据,然后将节点数据填充到知识模板的占位符当中,构成目标知识,并将目标知识保存到知识库中。以一个简单的知识模板“A是B的经理”为例,可以根据知识模板中定义的A,B的属性,比如A为人名,职务是经理,B为人名,职务是员工以及A与B的关系,从源数据中提取A和B对应的节点数据,即可以构成一条目标知识。比如A可以是张三,此时B是李四,A可以是王五,此时B是何六,这样便构成了两条知识,“张三是李四的经理”,“王五是何六的经理”。
当然,从数据库中获取的源数据可以是结构化数据,也可以是非结构化数据。对于结构化数据的数据,比如,一个员工关系数据表,由于数据是按照一定的结构关系存储,因而从中提取知识模板中各坑位对应的节点数据库会简单些。而对于非结构化的数据,比如,一段话、一篇文章,由于数据没有结构化,数据之间的关系需要去识别和提取,因而,提取节点数据时会相对复杂一些。如果源数据是结构化的数据,则可以采用程序编译提取占位符对应的节点数据的提取规则,程序可以根据提取规则自动从结构化的数据提取节点数据。在某些实施例中,还可以根据知识模板中占位符的属性采用SQL查询语句从结构化的源数据中将占位符对应的节点数据提取出来,通过SQL语句限定占位符中节点数据的查询规则,查询出相应的节点数据,并提取该节点数据填充到相应的占位符中。
在某些实施例中,如果源数据是非结构化的数据,则从源数据中提取知识模板中占位符对应的数据则可以采用深度学习模型提取。由于非结构化数据中数据比较零散,数据之间的关系也需要进一步去提取,因此,可以预先采用大量的数据样本对模型进行训练,让模型学习知识模板中各占位符对应的数据的一个潜在的关系规律,待模型达到一定准确率后,即可使用训练后的模型去从一段话,或一篇文章,以及一个表格中去提取知识模板中各占位符对应的节点数据。从源数据中提取知识模板的占位符对应的节点数据后,将节点数据填充到占位符当中,即构成目标知识,然后将构建的每条目标知识存储到知识库中。
在某些例子中,创建好知识模板后,可以将预先创建的各知识模板存储到知识库当中,并且为每个知识模板分配一个ID,在知识库中,所述ID与知识模板唯一对应,所述知识模板ID可以由数字构成,也可以由字母构成,由于在数据查询的时候,通过知识模板去查询目标知识,比较方便快捷,并且可以将该模板的所有知识查找出来,因而可以使用一些方便记忆的ID来表示某个业务领域的知识模板。
由于知识库中存储有各个知识模板的ID,在某些实施例中,将构建的目标知识存储到知识库中可以通过以下方法:每生成一条新的目标知识后,为所述目标知识分配一个ID,为所述目标知识中占位符填充的节点数据分配一个ID,然后将所述目标知识中各占位符填充的节点数据、所述目标知识的ID、所述知识模板的ID以及所述目标知识各占位符对应的节点数据的ID关联存储。举个例子,以知识模板“在A场景下,B系统调用C系统执行D功能”为例,其中A,B,C,D为四个占位符,假设知识模板存储在知识库中,模板ID为MB101,如果此时从源数据中提取了一条新的目标知识,为“在淘宝交易场景下,淘宝系统调用支付宝系统执行支付功能”,在生成新的目标知识后,为这个目标知识分配一个ID,假设为ZS101,然后知识模板中的各坑位对应的节点数据再分配一个ID,比如“淘宝交易场景”的ID为MB101-1-1,表示该节点数据是模板MB101第一个坑位对应的ID号为1的节点数据,“淘宝系统”的ID为MB101-2-1,“支付宝系统”的ID号为MB101-3-1,表示该节点数据是模板MB101第2个坑位对应的ID号为1的节点数据,“支付功能”的ID号为MB101-4-1,表示该节点数据是模板MB101第3个坑位对应的ID号为1的节点数据。然后将从源数据提取出来的节点数据存储到相应的知识模板对应的坑位的数据表中,如图4a所示,可以给每个模板的每个坑位建立一个数据表,专门用于存储这个模板该坑位的节点数据。最后可以将目标知识ID,目标知识的知识模板ID,目标知识中各占位符对应的节点数据ID存储在一个知识配置表当中,如图4b所示,知识配置表中说明了每条知识是由哪个模板,模板中对应的占位符中填充的是哪个节点数据构建。通过知识配置表中知识模板的ID以及模板各占位符对应的节点数据的ID则可以找到每条知识的知识模板以及各占位符节点数据,然后可以得到这一条知识。当然,在位节点数据生成ID之前,可以自动检测知识库中是否存储有这个节点数据,如果已存储与这个节点数据,则直接使用该节点数据对应的ID,可以不需要再次存储该节点数据。
通过以上方式将目标知识存储到知识库中后,如果知识库中的知识模板更新了,则可以非常方便和灵活地根据更新后的知识模板自动更新知识库。如果知识模板只是修改了预置文本,则只需修改知识库中的知识模板,其余内容则不需要变更。当知识模板中新增了占位符,则从源数据中提取与该占位符对应的节点数据,并生成所述节点数据的ID,将该节点数据,节点数据ID、知识模板ID以及目标知识ID关联存储。当知识模板中的占位符被删除后,则删除知识库中知识模板对应的占位符。举个例子,假设知识模板为“在A场景下,B系统调用C系统执行D功能”,如果为了让知识模板描述的知识更详细点,可能会对知识模板进行修改,并增加一个或多个占位符,比如将该知识模板修改成“在A场景下,B系统调用C系统的E接口执行D功能”,这行增加一个占位符E,E为系统的具体的某个接口,因而可以根据E的属性,从源数据中提取与E对应的节点数据,并为节点数据生成ID,与对应的目标知识关联起来存储。同理,如果,原来的模板为“在A场景下,B系统调用C系统的E接口执行D功能”,现在修改成“在A场景下,B系统调用C系统执行D功能”,则可以直接将知识库中知识模板的占位符E删除即可,其余则无需变更。总之,知识模板的预置文本可以灵活修改,占位符也灵活增加或删减。
为了进一步解释本说明书提供的知识库建立方法,以下再以一个具体的实施例加以说明。
某公司需要建立一个员工信息知识库,其中知识库中需要包含员工的离职信息。为了描述员工的离职信息,预先创建了知识模板“A因B辞去C一职,用于描述员工的离职信息,知识模板由预置文本“因”、“辞去”、“一职”和三个占位符A,B,C构成,知识模板中定义了三个占位符的属性,其中A对应的节点数据为人名,B对应的节点数据为离职原因,C对应的节点数据为岗位或职务名称。创建好知识模板后,将知识模板存储到知识库当中,并为该知识模板生成一个唯一的ID,ID为MB1,然后运行自定义的程序,自定义的程序会自动从数据库中获取源数据,获取到源数据后,则根据A,B,C三个占位符的属性从源数据中提取与三个占位符对应的节点数据,如果源数据为结构化的数据,则通过SQL查询语句从源数据中提取与占位符对应的节点数据,如果源数据为非结构化的数据,则可以通过深度学习模型从源数据中提取与占位符对应的节点数据。提取出节点数据后,将节点数据填充到知识模板的占位符中,以构建目标知识,比如“张三因个人原因辞去财务总监一职”、“李四因家庭原因辞去测试经理一职”。每生成以一条目标知识后,则为该目标知识生成一个ID,比如张三因个人原因辞去财务总监一职这条知识的ID为ZS1,然后为目标知识中占位符填充的节点数据生成一个ID,比如,张三对应的ID个为101,个人原因的ID为102,财务总监对应的ID为103,然后将各节点数据存储在知识模板中占位符对应的节点数据的数据表中,知识模板“A因B辞去C职务”中的三个占位符各有一个数据表,用于存储这个占位符对应的节点数据,比如将张三存储在占位符A的数据表中,个人原因存储在占位符B的数据表中,财务总监存储在占位符C的数据表中,然后将目标知识ID、知识模板ID以及节点数据ID关联存储在一个知识配置表中,通过这个知识配置表即可找到每一条知识,如图5所示,为目标知识“张三因个人原因辞去财务总监一职”的知识配置表,根据知识配置表中知识模板ID、模板中各占位符对应的节点数据的ID即可得到目标知识。当然,在构建好目标知识并存储后,如果知识库的模板被修改了,比如修改预置文本或增减占位符,还可以根据修改后的模板自动的更新知识库。
另外,本申请还提供了一种数据查询方法,所述数据查询方法用于从根据上述知识库建立方法建立的知识库中查询数据。当接收到查询请求后,根据查询请求从知识库中获取目标知识返回给用户。
在一个实施例中,可以通过知识模板的ID号查找目标知识,用户的查询请求中可以包括所要查询的目标知识对应的知识模板ID号,这样便可以查询到这个知识模板下的所有知识,当然,查询请求也可以包含知识模板ID和关键词,这样便可以更精确的查找到想要查询的目标知识。
与本说明书提供的知识库建立的方法实施例相对应,本说明还提供了一种知识库建立装置,如图6所示,所述装置60包括:
获取模块61,从数据库中获取源数据;
提取模块62,根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据,其中,所述知识模板根据目标知识所属的业务领域预先创建,所述知识模板包括预置文本和至少一个占位符,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则;
填充模块63,将所述节点数据填充到所述知识模板的占位符中,以构建目标知识,所述目标知识通过所述预置文本和所述节点数据描述;
存储模块64,将所述目标知识存储到知识库中。
在一个实施例中,所述源数据为非结构化数据,则根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据基于深度学习模型提取。
在一个实施例中,所述源数据为结构化数据,则根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据包括:
根据知识模板中占位符的属性,采用SQL查询语句从所述源数据中提取与所述占位符对应的节点数据。
在一个实施例中,所述知识模板存储于所述知识库中,并且在所述知识库中有唯一对应的ID。
在一个实施例中,将所述目标知识存储到知识库中具体包括:
生成所述目标知识的ID以及所述目标知识中各占位符填充的节点数据的ID;
将所述目标知识的ID、所述知识模板的ID、所述目标知识中各占位符填充的节点数据以及所述节点数据的ID关联存储。
在一个实施例中,将所述目标知识存储到知识库中后,还包括:
当所述知识模板中的占位符被删除时,则删除所述占位符对应的节点数据以及所述节点数据的ID。
上述装置中各个单元的功能和作用的实现过程具体详见上述方法中对应步骤的实现过程,在此不再赘述。
对于装置实施例而言,由于其基本对应于方法实施例,所以相关之处参见方法实施例的部分说明即可。以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本申请方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
从硬件层面而言,如图7所示,为本说明书的预加载页面装置所在设备的一种硬件结构图,除了图7所示的处理器701、网络接口704、内存702以及非易失性存储器703之外,实施例中装置所在的设备通常还可以包括其他硬件,如负责处理报文的转发芯片等;从硬件结构上来讲该设备还可能是分布式的设备,可能包括多个接口卡,以便在硬件层面进行报文处理的扩展。
所述非易失性存储器703存储有用于存储可执行的计算机指令,处理器704执行所述计算机指令时实现以下步骤:
从数据库中获取源数据;
根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据,其中,所述知识模板根据目标知识所属的业务领域预先创建,所述知识模板包括预置文本和至少一个占位符,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则;
将所述节点数据填充到所述知识模板的占位符中,以构建目标知识,所述目标知识通过所述预置文本和所述节点数据描述;
将所述目标知识存储到知识库中。
此外,本申请还提供了一种数据查询的方法,所述方法用于通过上述知识库的建立方法建立的知识库中查询数据,由于将知识通过知识模板管理起来,查询知识变得更加方便和简单。在某些实施例中,查询知识的时候可以通过输入知识模板在知识库中对应的ID号去查询,这样便可以得到这个模板对应的所有知识,当然也可以通过输入知识模板ID和节点数据去查询,以“在A场景下,B系统调用C系统的E接口执行D功能”这一知识模板为例,输入该知识模板的ID以及一个场景,则可以查询到该场景下,各种系统调用的情况。
由于本申请对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台终端设备执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(Random AccessMemory,RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅为本申请的较佳实施例而已,并不用以限制本申请,凡在本申请的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本申请保护的范围之内。

Claims (10)

1.一种知识库的建立方法,包括:
从数据库中获取源数据;
根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据,其中,所述知识模板根据目标知识所属的业务领域预先创建,所述知识模板包括预置文本和至少一个占位符,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则;
将所述节点数据填充到所述知识模板的占位符中,以构建目标知识,所述目标知识通过所述预置文本和所述节点数据描述;
将所述目标知识存储到知识库中。
2.根据权利要求1所述的知识库的建立方法,所述源数据为非结构化数据,则根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据基于深度学习模型提取。
3.根据权利要求1所述的知识库的建立方法,所述源数据为结构化数据,则根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据包括:
根据知识模板中占位符的属性,采用SQL查询语句从所述源数据中提取与所述占位符对应的节点数据。
4.根据权利要求1所述的知识库的建立方法,所述知识模板存储于所述知识库中,并且在所述知识库中有唯一对应的ID。
5.根据权利要求4所述的知识库的建立方法,将所述目标知识存储到知识库中具体包括:
生成所述目标知识的ID以及所述目标知识中各占位符填充的节点数据的ID;
将所述目标知识的ID、所述知识模板的ID、所述目标知识中各占位符填充的节点数据以及所述节点数据的ID关联存储。
6.根据权利要求1所述的知识库的建立方法,将所述目标知识存储到知识库中后,还包括:
当所述知识模板被更新后,根据更新后的知识模板更新所述知识库。
7.一种知识库的建立装置,包括:
获取模块,从数据库中获取源数据;
提取模块,根据知识模板中的占位符的属性,从所述源数据中提取与所述占位符对应的节点数据,其中,所述知识模板根据目标知识所属的业务领域预先创建,所述知识模板包括预置文本和至少一个占位符,所述占位符的属性用于描述从所述源数据中提取所述占位符对应的节点数据的规则;
填充模块,将所述节点数据填充到所述知识模板的占位符中,以构建目标知识,所述目标知识通过所述预置文本和所述节点数据描述;
存储模块,将所述目标知识存储到知识库中。
8.一种设备,所述设备包括:
存储器,用于存储可执行的计算机指令;
处理器,用于执行所述计算机指令时实现权利要求1至6任一所述方法的步骤。
9.一种数据查询方法,包括:
当接收到用户的查询请求时,根据所述查询请求从根据权利要求1至6所述的知识库建立方法建立的知识库中获取目标知识,将所述目标知识返回给用户。
10.根据权利要求9所述的数据查询方法,所述查询请求至少包括:所述目标知识对应的知识模板的ID。
CN201910091609.7A 2019-01-30 2019-01-30 一种知识库的建立方法、装置及设备 Active CN110019754B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910091609.7A CN110019754B (zh) 2019-01-30 2019-01-30 一种知识库的建立方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910091609.7A CN110019754B (zh) 2019-01-30 2019-01-30 一种知识库的建立方法、装置及设备

Publications (2)

Publication Number Publication Date
CN110019754A true CN110019754A (zh) 2019-07-16
CN110019754B CN110019754B (zh) 2023-11-07

Family

ID=67188951

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910091609.7A Active CN110019754B (zh) 2019-01-30 2019-01-30 一种知识库的建立方法、装置及设备

Country Status (1)

Country Link
CN (1) CN110019754B (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111858965A (zh) * 2020-08-04 2020-10-30 中国银行股份有限公司 知识库生成方法及装置
CN112307153A (zh) * 2020-09-30 2021-02-02 杭州量知数据科技有限公司 一种产业知识库自动构建方法、装置及存储介质
CN112560476A (zh) * 2020-12-09 2021-03-26 中科讯飞互联(北京)信息科技有限公司 文本补全方法以及电子设备、存储装置
CN112818098A (zh) * 2021-01-29 2021-05-18 平安国际智慧城市科技股份有限公司 基于知识库的对话生成方法、装置、终端及存储介质
CN113051879A (zh) * 2019-12-26 2021-06-29 东软集团(上海)有限公司 智能签批方法、装置以及存储介质
CN113128189A (zh) * 2019-12-30 2021-07-16 东软集团(上海)有限公司 办公常用语录入方法和装置
CN115391439A (zh) * 2022-08-24 2022-11-25 中化现代农业有限公司 文档数据导出方法、装置、电子设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050086222A1 (en) * 2003-10-16 2005-04-21 Wang Ji H. Semi-automatic construction method for knowledge base of encyclopedia question answering system
CN106156083A (zh) * 2015-03-31 2016-11-23 联想(北京)有限公司 一种领域知识处理方法及装置
CN107798123A (zh) * 2017-11-10 2018-03-13 上海智臻智能网络科技股份有限公司 知识库及其建立、修改、智能问答方法、装置及设备
CN108897728A (zh) * 2018-06-27 2018-11-27 平安科技(深圳)有限公司 短信拼接处理方法、装置、计算机设备和存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050086222A1 (en) * 2003-10-16 2005-04-21 Wang Ji H. Semi-automatic construction method for knowledge base of encyclopedia question answering system
CN106156083A (zh) * 2015-03-31 2016-11-23 联想(北京)有限公司 一种领域知识处理方法及装置
CN107798123A (zh) * 2017-11-10 2018-03-13 上海智臻智能网络科技股份有限公司 知识库及其建立、修改、智能问答方法、装置及设备
CN108897728A (zh) * 2018-06-27 2018-11-27 平安科技(深圳)有限公司 短信拼接处理方法、装置、计算机设备和存储介质

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113051879A (zh) * 2019-12-26 2021-06-29 东软集团(上海)有限公司 智能签批方法、装置以及存储介质
CN113128189A (zh) * 2019-12-30 2021-07-16 东软集团(上海)有限公司 办公常用语录入方法和装置
CN111858965A (zh) * 2020-08-04 2020-10-30 中国银行股份有限公司 知识库生成方法及装置
CN112307153A (zh) * 2020-09-30 2021-02-02 杭州量知数据科技有限公司 一种产业知识库自动构建方法、装置及存储介质
CN112307153B (zh) * 2020-09-30 2022-06-10 杭州量知数据科技有限公司 一种产业知识库自动构建方法、装置及存储介质
CN112560476A (zh) * 2020-12-09 2021-03-26 中科讯飞互联(北京)信息科技有限公司 文本补全方法以及电子设备、存储装置
CN112818098A (zh) * 2021-01-29 2021-05-18 平安国际智慧城市科技股份有限公司 基于知识库的对话生成方法、装置、终端及存储介质
CN112818098B (zh) * 2021-01-29 2023-11-24 深圳平安智慧医健科技有限公司 基于知识库的对话生成方法、装置、终端及存储介质
CN115391439A (zh) * 2022-08-24 2022-11-25 中化现代农业有限公司 文档数据导出方法、装置、电子设备和存储介质

Also Published As

Publication number Publication date
CN110019754B (zh) 2023-11-07

Similar Documents

Publication Publication Date Title
CN110019754A (zh) 一种知识库的建立方法、装置及设备
CN110908997B (zh) 数据血缘构建方法、装置、服务器及可读存储介质
CN109299090B (zh) 基金中心度计算方法、系统、计算机设备和存储介质
CN108733713A (zh) 数据仓库中的数据查询方法及装置
US8892545B2 (en) Generating a compiler infrastructure
CN111046237B (zh) 用户行为数据处理方法、装置、电子设备及可读介质
CN111160658B (zh) 一种协同制造资源优配方法、系统和平台
US20120158807A1 (en) Matching data based on numeric difference
CN104579909B (zh) 一种用户信息的分类、用户分组信息的获取方法和设备
US20130238549A1 (en) Using Dimension Substitutions in OLAP Cubes
US9652740B2 (en) Fan identity data integration and unification
CN109002470A (zh) 知识图谱构建方法及装置、客户端
CN106156040A (zh) 多维度数据管理方法及装置
CN114820080A (zh) 基于人群流转的用户分群方法、系统、装置及介质
CN114722036A (zh) 数据处理方法、装置、电子设备及可读存储介质
CN111414361A (zh) 标签数据存储方法、装置、设备及可读存储介质
CN112068812B (zh) 一种微服务生成方法、装置、计算机设备和存储介质
US20120078967A1 (en) Integration of a Framework Application and a Task Database
CN110062112A (zh) 数据处理方法、装置、设备及计算机可读存储介质
KR20200119108A (ko) 데이터베이스를 위지윅으로 구축하는 방법
CN107767278B (zh) 社群层次结构构建方法和装置
CN115098738A (zh) 业务数据的提取方法、装置、存储介质及电子设备
US11580125B2 (en) Information system with temporal data
US11144520B2 (en) Information system with versioning descending node snapshot
US20180144150A1 (en) Unified instance authorization based on attributes and hierarchy assignment

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 40012078

Country of ref document: HK

TA01 Transfer of patent application right
TA01 Transfer of patent application right

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20200923

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

GR01 Patent grant
GR01 Patent grant