CN109558415A - 知识库更新方法及装置 - Google Patents

知识库更新方法及装置 Download PDF

Info

Publication number
CN109558415A
CN109558415A CN201811385649.4A CN201811385649A CN109558415A CN 109558415 A CN109558415 A CN 109558415A CN 201811385649 A CN201811385649 A CN 201811385649A CN 109558415 A CN109558415 A CN 109558415A
Authority
CN
China
Prior art keywords
data
knowledge base
time
time attribute
finance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201811385649.4A
Other languages
English (en)
Inventor
郑博
叶天生
梁栋
王宏志
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Squirrel Hill Technology Co Ltd
Original Assignee
Beijing Squirrel Hill Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Squirrel Hill Technology Co Ltd filed Critical Beijing Squirrel Hill Technology Co Ltd
Priority to CN201811385649.4A priority Critical patent/CN109558415A/zh
Publication of CN109558415A publication Critical patent/CN109558415A/zh
Pending legal-status Critical Current

Links

Landscapes

  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种知识库更新方法及装置,其中方法包括:实时确定写入所述知识库的数据;确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。因而只有时间相同的数据才能产生联系。如果金融数据出现变化,就将已经更新过的金融数据重新输入并加上了新的时间,这样原本的候选关系集也就得到了更新,最后产生的知识库便也可以更新。达到了知识库便可以根据金融数据的更新而更新,知识库也就有了时效性的目的。

Description

知识库更新方法及装置
技术领域
本申请涉及知识库数据处理技术领域,具体而言,涉及一种知识库更新方法。
背景技术
随着金融数据模式的多样化,原本只基于文本金融数据的KBC(知识库构建)技术已经逐渐落后,我们需要基于多模式化的金融数据的KBC技术。但是因为金融数据的多模式化,这种KBC技术存在许多只基于文本金融数据的KBC技术没有的问题。
现存的KBC技术为了解决金融数据多模式化的问题设计了一个新的数据模型来存储这些多模式化的金融数据。先通过用户指定的数据模式建立一个新的数据模型,数据模型中不仅保存了输入的多个模式的金融数据,还保存了数据模式的特征,这样便可将原来输入的多模式金融数据的数据和格式都完整的保存下来;基于这个数据模型生成候选关系集,因为输入的数据很多,如果每两个属性间都产生候选关系,就会有组合爆炸的情况产生,让系统无法处理,所以需要用户输入函数来筛选候选关系;下一步就是生成多模式的特征,先生成文本特征,再自动生成其他格式(例如表格,结构,可视化格式)的特征,将这些模式的特征和文本特征进行结合,将其他格式的特征看做文本特征的补充,这样就能生成一个完整的多模式特征;最后再由用户输入分类函数,便可判断候选关系是否存在,生成知识库。
缺陷:在生成候选集的时候,候选关系的生成没有考虑时效性,有的候选关系可能随着时间的推移而不再存在,但是知识库中并没有更新。
针对相关技术中存在的问题,目前尚未提出有效的解决方案。
发明内容
本申请的主要目的在于提供一种知识库便可以根据数据的更新而更新,使知识库也就有了时效性的知识库更新方法及装置,以解决相关技术中存在的技术问题。
为了实现上述目的,根据本申请的一个方面,提供了一种知识库更新方法。
根据本申请的知识库更新方法包括:
实时确定写入所述知识库的数据;
确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;
对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。
进一步的,如前述的知识库更新方法,还包括:
预先确定从知识库中匹配数据的匹配函数库;
在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。
进一步的,如前述的知识库更新方法,所述数据为多模式金融数据,包括:表格模式金融数据、结构模式金融数据和可视化格式金融数据。
进一步的,如前述的知识库更新方法,还包括:
接收对所述知识库中的第一数据的进行编辑的编辑指令;
根据所述编辑指令对所述第一数据的进行编辑,并更新所述第一数据的时间属性。
进一步的,如前述的知识库更新方法,在得到数据更新后的知识库之后,还包括:
确定所述知识库中的所有数据及每个数据对应的时间属性;
按照所述时间属性对所述所有数据进行排序存储。
为了实现上述目的,根据本申请的另一方面,提供了一种知识库更新装置。
根据本申请的知识库更新装置包括:
数据确定单元,用于实时确定写入所述知识库的数据;
时间属性生成单元,用于确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;
时间属性添加单元,用于对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。
进一步的,如前述的知识库更新装置,还包括:匹配函数单元;所述匹配函数单元包括:
匹配函数库确定模块,用于预先确定从知识库中匹配数据的匹配函数库;
匹配函数添加模块,用于在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。
进一步的,如前述的知识库更新装置,所述数据为多模式金融数据,包括:表格模式金融数据、结构模式金融数据和可视化格式金融数据。
进一步的,如前述的知识库更新装置,还包括:编辑单元;所述编辑单元包括:
编辑指令接收模块,用于接收对所述知识库中的第一数据的进行编辑的编辑指令;
时间属性更新模块,用于根据所述编辑指令对所述第一数据的进行编辑,并更新所述第一数据的时间属性。
进一步的,如前述的知识库更新装置,还包括:知识库整理单元;所述知识库整理单元包括:
时间属性确定模块,用于确定所述知识库中的所有数据及每个数据对应的时间属性;
排序模块,用于按照所述时间属性对所述所有数据进行排序存储。
在本申请实施例中,采用对知识库中的数据添加时间属性的知识库更新方法及装置的方式,通过实时确定写入所述知识库的数据;确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。因而只有时间相同的数据才能产生联系。如果金融数据出现变化,就将已经更新过的金融数据重新输入并加上了新的时间,这样原本的候选关系集也就得到了更新,最后产生的知识库便也可以更新。达到了知识库便可以根据金融数据的更新而更新,知识库也就有了时效性的目的。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,使得本申请的其它特征、目的和优点变得更明显。本申请的示意性实施例附图及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请一种实施例的知识库更新方法流程示意图;
图2是根据本申请一种实施例的对知识库中的数据进行编辑的方法流程示意图;
图3是根据本申请一种实施例的对知识库中的数据进行排序的方法流程示意图;以及
图4是根据本申请一种实施例的知识库更新装置的功能模块结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
在本申请中,术语“上”、“下”、“左”、“右”、“前”、“后”、“顶”、“底”、“内”、“外”、“中”、“竖直”、“水平”、“横向”、“纵向”等指示的方位或位置关系为基于附图所示的方位或位置关系。这些术语主要是为了更好地描述本申请及其实施例,并非用于限定所指示的装置、元件或组成部分必须具有特定方位,或以特定方位进行构造和操作。
并且,上述部分术语除了可以用于表示方位或位置关系以外,还可能用于表示其他含义,例如术语“上”在某些情况下也可能用于表示某种依附关系或连接关系。对于本领域普通技术人员而言,可以根据具体情况理解这些术语在本申请中的具体含义。
此外,术语“安装”、“设置”、“设有”、“连接”、“相连”、“套接”应做广义理解。例如,可以是固定连接,可拆卸连接,或整体式构造;可以是机械连接,或电连接;可以是直接相连,或者是通过中间媒介间接相连,又或者是两个装置、元件或组成部分之间内部的连通。对于本领域普通技术人员而言,可以根据具体情况理解上述术语在本申请中的具体含义。
需要说明的是,在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本申请。
为了实现上述目的,根据本申请的一个方面,提供了一种知识库更新方法。如图1所示,该方法包括如下的步骤S1至步骤S3:
S1.实时确定写入所述知识库的数据;具体的,以金融数据为例,每当有新的金融数据需要写入金融数据知识库中时,实时获取该新写入的金融数据的各种信息;
S2.确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;具体的,在所述步骤S1的基础上,在识别到所述知识库中有新的金融数据写入的时候,即刻获取当下的时间信息,然后根据所述时间信息生成相应的所述新的金融数据的时间属性;
S3.对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。具体的,在所述步骤S2的基础上,将所述时间属性通过写入或绑定的方式添加进所述新写入的金融数据中,进而使每个所述新写入的金融数据都有唯一对应的时间属性;并进而得到数据更新后的知识库。
在一些实施例中,如前述的知识库更新方法,还包括:
预先确定从知识库中匹配数据的匹配函数库;具体的,通过确定匹配知识库后,才能够从其中存储或调取各种用于实现各种不同匹配规则的匹配函数;所述匹配函数库用于存储生成候选关系集时需要的各种函数,不同的所述函数用于联系的属性可以分别包括:时间属性、数据属性、数据类别、具体数据内容等;
在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。
在一些实施例中,如前述的知识库更新方法,所述数据为多模式金融数据,包括:表格模式金融数据、结构模式金融数据和可视化格式金融数据。
在一些实施例中,如前述的知识库更新方法,如图2所示,还包括如下所述步骤S4和S5:
S4.接收对所述知识库中的第一数据的进行编辑的编辑指令;具体的,以金融数据为例,当存在用户需要对知识库中的金融数据进行文本特征或表格,结构,可视化格式等特征进行编辑的时候,接收所述用户发送的编辑指令;
S5.根据所述编辑指令对所述第一数据的进行编辑,并更新所述第一数据的时间属性。根据所述编辑指令对所述金融数据进行编辑,具体的,当对所述金融数据进行持续长时间编辑或多次编辑的时候,以最后结束编辑的时间生成最新的时间属性,并更新编辑后的所述金融数据的时间属性。
进而通过本实施例中的方法能够在对知识库中的数据进行编辑之后及时更新其中的时间属性,使知识库可以根据其中数据的更新而更新,因此知识库也就有了时效性。
在一些实施例中,如前述的知识库更新方法,在得到数据更新后的知识库之后,如图3所示,还包括如下所述步骤S6和S7:
S6.确定所述知识库中的所有数据及每个数据对应的时间属性;具体的,以金融数据为例,对于知识库中的每个金融数据,都获取其对应的时间属性,进而根据所述时间属性确定其写入所述知识库中的时间信息;
S7.按照所述时间属性对所述所有数据进行排序存储。具体的,可以根据时间信息的按照时间由近及远或由远及近的方式对所述金融数据或者金融数据的存储地址进行排序存储,具体的,只需能够按照时间准确定位到对应的数据即可。
采用本实施例的方法可以使得各种金融数据按序排列,保证了知识库的存储的数据的有序性,更易于数据的统一管理。
在本申请实施例中,采用对知识库中的数据添加时间属性的知识库更新方法及装置的方式,通过实时确定写入所述知识库的数据;确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。因而只有时间相同的数据才能产生联系。如果金融数据出现变化,就将已经更新过的金融数据重新输入并加上了新的时间,这样原本的候选关系集也就得到了更新,最后产生的知识库便也可以更新。达到了知识库便可以根据金融数据的更新而更新,知识库也就有了时效性的目的。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
根据本发明实施例,还提供了一种用于实施上述知识库更新方法的知识库更新装置,如图4所示,该装置包括:
数据确定单元1,用于实时确定写入所述知识库的数据;
时间属性生成单元2,用于确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;
时间属性添加单元3,用于对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
在一些实施例中,如前述的知识库更新装置,还包括:匹配函数单元;所述匹配函数单元包括:
匹配函数库确定模块,用于预先确定从知识库中匹配数据的匹配函数库;
匹配函数添加模块,用于在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
在一些实施例中,如前述的知识库更新装置,所述数据为多模式金融数据,包括:表格模式金融数据、结构模式金融数据和可视化格式金融数据。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
在一些实施例中,如前述的知识库更新装置,还包括:编辑单元;所述编辑单元包括:
编辑指令接收模块,用于接收对所述知识库中的第一数据的进行编辑的编辑指令;
时间属性更新模块,用于根据所述编辑指令对所述第一数据的进行编辑,并更新所述第一数据的时间属性。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
在一些实施例中,如前述的知识库更新装置,还包括:知识库整理单元;所述知识库整理单元包括:
时间属性确定模块,用于确定所述知识库中的所有数据及每个数据对应的时间属性;
排序模块,用于按照所述时间属性对所述所有数据进行排序存储。
具体的,本发明实施例的装置中各模块实现其功能的具体过程可参见方法实施例中的相关描述,此处不再赘述。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种知识库更新方法,其特征在于,包括:
实时确定写入所述知识库的数据;
确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;
对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。
2.根据权利要求1所述的知识库更新方法,其特征在于,还包括:
预先确定从知识库中匹配数据的匹配函数库;
在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。
3.根据权利要求1所述的知识库更新方法,其特征在于,所述数据为多模式金融数据,包括:表格模式金融数据、结构模式金融数据和可视化格式金融数据。
4.根据权利要求1所述的知识库更新方法,其特征在于,还包括:
接收对所述知识库中的第一数据的进行编辑的编辑指令;
根据所述编辑指令对所述第一数据的进行编辑,并更新所述第一数据的时间属性。
5.根据权利要求1所述的知识库更新方法,其特征在于,在得到数据更新后的知识库之后,还包括:
确定所述知识库中的所有数据及每个数据对应的时间属性;
按照所述时间属性对所述所有数据进行排序存储。
6.一种知识库更新装置,其特征在于,包括:
数据确定单元,用于实时确定写入所述知识库的数据;
时间属性生成单元,用于确定所述数据加入所述知识库的时间,并根据所述时间生成对应的时间属性;
时间属性添加单元,用于对加入所述知识库后的所述数据添加所述时间属性;并得到数据更新后的知识库。
7.根据权利要求6所述的知识库更新装置,其特征在于,还包括:匹配函数单元;所述匹配函数单元包括:
匹配函数库确定模块,用于预先确定从知识库中匹配数据的匹配函数库;
匹配函数添加模块,用于在所述匹配函数库中添加时间匹配函数,用于根据时间属性匹配对应的数据;其中,所述时间匹配函数为当不同的数据中时间属性相同时才能产生相互联系的函数。
8.根据权利要求6所述的知识库更新装置,其特征在于,所述数据为多模式金融数据,包括:表格模式金融数据、结构模式金融数据和可视化格式金融数据。
9.根据权利要求6所述的知识库更新装置,其特征在于,还包括:编辑单元;所述编辑单元包括:
编辑指令接收模块,用于接收对所述知识库中的第一数据的进行编辑的编辑指令;
时间属性更新模块,用于根据所述编辑指令对所述第一数据的进行编辑,并更新所述第一数据的时间属性。
10.根据权利要求6所述的知识库更新装置,其特征在于,还包括:知识库整理单元;所述知识库整理单元包括:
时间属性确定模块,用于确定所述知识库中的所有数据及每个数据对应的时间属性;
排序模块,用于按照所述时间属性对所述所有数据进行排序存储。
CN201811385649.4A 2018-11-20 2018-11-20 知识库更新方法及装置 Pending CN109558415A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811385649.4A CN109558415A (zh) 2018-11-20 2018-11-20 知识库更新方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811385649.4A CN109558415A (zh) 2018-11-20 2018-11-20 知识库更新方法及装置

Publications (1)

Publication Number Publication Date
CN109558415A true CN109558415A (zh) 2019-04-02

Family

ID=65866645

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811385649.4A Pending CN109558415A (zh) 2018-11-20 2018-11-20 知识库更新方法及装置

Country Status (1)

Country Link
CN (1) CN109558415A (zh)

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930478A (zh) * 2010-09-19 2010-12-29 无锡诺宝科技发展有限公司 具有内容更新功能的有限信息储存、挖掘搜索系统
CN103870465A (zh) * 2012-12-07 2014-06-18 厦门雅迅网络股份有限公司 一种非入侵式的数据库爬虫的实现方法
CN106557482A (zh) * 2015-09-25 2017-04-05 阿里巴巴集团控股有限公司 一种库存系统数据更新方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101930478A (zh) * 2010-09-19 2010-12-29 无锡诺宝科技发展有限公司 具有内容更新功能的有限信息储存、挖掘搜索系统
CN103870465A (zh) * 2012-12-07 2014-06-18 厦门雅迅网络股份有限公司 一种非入侵式的数据库爬虫的实现方法
CN106557482A (zh) * 2015-09-25 2017-04-05 阿里巴巴集团控股有限公司 一种库存系统数据更新方法及装置

Similar Documents

Publication Publication Date Title
CN108984712A (zh) 基于业务场景的造数方法、设备及可读存储介质
CN102254029B (zh) 一种基于视图的数据访问系统及其方法
CN107818168B (zh) 题目搜索方法、装置及设备
CN106155769A (zh) 一种工作流处理方法、装置及工作流引擎
CN101650717A (zh) 一种节约数据库存储空间的方法和系统
CN111008521B (zh) 生成宽表的方法、装置及计算机存储介质
CN102970373B (zh) 一种数据同步方法、装置及系统
CN103455589B (zh) 产品工厂模式下的产品数据迁移方法、装置及系统
CN105740337A (zh) 一种基于内容的发布订阅系统中的事件快速匹配方法
CN104133765B (zh) 网络活动的测试用例发送方法及测试用例服务器
CN104536997A (zh) 用于客户端界面的数据批量处理方法及装置
CN103714086A (zh) 用于生成非关系数据库的模式的方法和设备
CN108829651A (zh) 一种公文处理的方法、装置、终端设备及存储介质
CN109726295A (zh) 品牌知识图谱显示方法、装置、图服务器及存储介质
CN102521713B (zh) 数据处理装置和数据处理方法
CN108959294A (zh) 一种访问搜索引擎的方法和装置
CN110278565B (zh) 一种基站设计方法及装置
CN104463460A (zh) 用于网络数据投放的排期信息的处理方法及装置
CN109558415A (zh) 知识库更新方法及装置
CN109299241A (zh) 聊天机器人的知识库生成方法及装置
CN110852701A (zh) 产品需求管理方法、装置和系统
CN104239314A (zh) 一种扩展检索词的方法和系统
CN105653533A (zh) 一种更新分类关联词集合的方法和装置
CN114297381A (zh) 文本处理方法、装置、设备及存储介质
CN107729579A (zh) 数据库分离设计方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190402

RJ01 Rejection of invention patent application after publication