CN107463649A - 一种基于具名图的知识图谱时间演化方法 - Google Patents
一种基于具名图的知识图谱时间演化方法 Download PDFInfo
- Publication number
- CN107463649A CN107463649A CN201710620086.1A CN201710620086A CN107463649A CN 107463649 A CN107463649 A CN 107463649A CN 201710620086 A CN201710620086 A CN 201710620086A CN 107463649 A CN107463649 A CN 107463649A
- Authority
- CN
- China
- Prior art keywords
- time
- period
- signature
- resource
- geologic
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013507 mapping Methods 0.000 title claims abstract description 60
- 238000000034 method Methods 0.000 title claims abstract description 56
- 230000036962 time dependent Effects 0.000 title claims abstract description 15
- 230000008569 process Effects 0.000 claims description 17
- 230000008859 change Effects 0.000 claims description 5
- 230000002123 temporal effect Effects 0.000 claims description 4
- 238000011161 development Methods 0.000 claims description 3
- 238000001228 spectrum Methods 0.000 claims 1
- 230000000694 effects Effects 0.000 abstract description 3
- 238000011160 research Methods 0.000 description 3
- PEDCQBHIVMGVHV-UHFFFAOYSA-N Glycerine Chemical compound OCC(O)CO PEDCQBHIVMGVHV-UHFFFAOYSA-N 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000006243 chemical reaction Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 230000036541 health Effects 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
- 238000012800 visualization Methods 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/36—Creation of semantic tools, e.g. ontology or thesauri
- G06F16/367—Ontology
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Life Sciences & Earth Sciences (AREA)
- Animal Behavior & Ethology (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供一种基于具名图的知识图谱时间演化方法,该方法首先,根据需要划分好不同的时间段或时间点。然后,通过具名图来为知识图谱中原有的“三元组”加入一个具名图,向不同具名图添加“三元组”和它所对应的时间,得到一个携带时间描述的“四元组”,格式为(<subject>‑><predicate>‑><object>,{time})。知识图谱就可以根据读取不同的图来展示不同时空里的同一“三元组”,实现时空演化效果。
Description
技术领域
本发明涉及知识图谱领域,更具体地,涉及一种基于具名图的知识图谱时间演化方法。
背景技术
技术背景:知识图谱以本体技术为核心,通过将应用数学、图形学、信息可视化技术、信息科学等学科的理论与方法结合,并利用可视化的图谱形象地展示学科的核心结构、发展历史、前沿领域以及整体知识架构达到多学科融合目的的现代理论。知识图谱特别适合于解决内容关系复杂领域的知识管理问题,在国内外医疗卫生、电子商务、生物化学、国防军事、人文历史等各个领域将有广泛的应用。知识图谱主要以RDF(ResourceDescription Framework)三元组的方法来描述各种资源。知识图谱中包括知识点(Instance)、知识分类(Class)、知识属性(Property)、知识属性值(Property Value)和知识关系(Object Property)。但是传统的知识图谱只是将资源拆分成三个元组,这样只能体现资源的客观性,却无法体现资源一些状态的变化(包括时间在内)。如何在原有的RDF三元组的基础上,展示资源在不同的时间里的演变情况,成为知识图谱在不同学科领域中亟待解决的热点问题。现有方案:传统的知识图谱利用RDF来拆分资源,格式为<subject>-><predicate>-><object>(即主语、谓语、宾语)。
现有的知识图谱只能客观地描述资源,却无法体现资源在不同时间里的演变情况。涉及时间状态变换的资源仅使用传统知识图谱的“三元组”方法无法展示,是现在知识图谱的一个不足之处。
发明内容
本发明为提供一种基于具名图的知识图谱时间演化方法,该方法对科研项目申报信息推荐高度支持、计算复杂度低,而且能处理科研人员具有大量科研背景下的推荐。
为了达到上述技术效果,本发明的技术方案如下:
一种基于具名图的知识图谱时间演化方法,包括以下步骤:
S1:构建一个知识图谱K;
S2:将得到的知识图谱K进行手动划分;
S3:利用划分的知识图谱构建具名图;
S4:使用SPARQL读取具名图来获取更全面的资源。
进一步地,所述步骤S1的具体过程如下:
S11:为知识图谱构建时间类,获得时间集合T,该集合包括时间点、时间段和地质时期,其中,用来表示时间维度的时间实体都有hasTRS:TRS属性,该属性为实体加入String格式的字符串或者表示日期的纯数字,为TRS属性添加时间属性值;
S12:以时间点进行时间划分,某时间点t1在时间集合T中,即t1∈T,为时间实体的TRS属性添加一个纯数字时间属性值——时间点t1,在时间点t1之前的时间拥有time:before属性,时间点的集合为d1before,在时间点t1之后的时间拥有time:after属性,时间点的集合为d1after;
S13:以某一段时间范围t2~t3划分出时间段T4,且T4∈T,首先确定不同时间段的准确起始时间点,时间段的起始属性为time:hasBeginning,时间段的结束属性为time:hasEnd,结合S12中根据时间点划分时间的方法,该时间段的三元组表示为({time:T4time:hasBeginning time:t2},{time:T4 time:hasEnd time:t3}),该时间段的集合可表示为T4=[d2after,d3before],若时间段T4中不包含起始时间点和结束时间点,根据S12的时间点划分方法,该时间段的三元组表示为({time:T4 time:after time:t2}∩{time:T4 time:before time:t3}),则表示为T4={d2after,d3before};
S14:以地质时期进行划分,包括朝代名称,为时间实体的TRS加入一串字符串,代表该地质时期,根据S13中时间段的划分方法,该地质时期的“三元组”表示是“{time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间}”或“{time:地质时期time:after time:起始时间}∩{time:地质时期time:beforetime:结束时间}”;
S15:为三元组添加时长描述,通过time:hasDuration属性为时间实体添加时长,这个时长是具体的数量,包括1年、6个月、2天、15小时,该三元组表示为“time:TemporalEntity time:hasDuration time:value”;
S16:为三元组添加已被格式化后的日历或时钟格式的具体时间包括年、月、日、周、时、分、秒,通过time:hasGeneralDurationDescription属性为时间实体添加具体的格式化时间,该三元组表示为“time:TemporalEntity time:hasGeneralDurationDescription time:Format time”。
进一步地,所述步骤S2的具体过程如下:
S21:根据时间点划分原则进行划分,根据知识图谱中涵盖的n个时间点划分n个知识图谱,不同时间点的知识图谱仅存有该时间点拥有的资源;
S22:根据时间段划分原则进行划分,根据知识图谱中涵盖的ni个连续的时间点组成的n0-j段时间段(j≤i),不同的时间段中存有该时间段里多个时间点的所有资源;
S23:根据地质时期划分原则进行划分,根据知识图谱中所包含的地质时期(String类型)个体,每个地质时期个体都是涵盖了ni个连续的时间点组成的n0-j段时间段(j≤i),不同的地质时期中存有该时间段里多个时间点的所有资源;
S24:复制多个相同的知识图谱,分别命名为K1,K2,K3,……,Kn;
S25:根据需要所对应的时间原则划分好知识图谱的后,将属于不同时间的资源分别放入K1,K2,K3,……,Kn中。
进一步地,所述步骤S3包括以时间点划分时间的资源描述,其过程是:
S311:根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的时间点,Utime∈T;
S312:多个不同时间点t5的资源,它们的具名图的URI描述Utime={t1,t2,t3,……,tn},将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{ti});
S313:所有在T中的资源,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{t1,t2,t3,……,tn})。
进一步地,所述步骤S3包括以时间段划分时间的资源描述,其过程是:
S321:根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的时间点,Utime∈T;
S322:多个不同时间段T5的资源,根据(1-2-2)的划分方法,它们的具名图的URI描述Utime=({time:T5 time:hasBeginning time:ti},{time:T5 time:hasEnd time:tj})或Utime=({time:T5 time:after time:ti}∩{time:T5 time:before time:tj}),将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{{time:T5 time:hasBeginningtime:ti},{time:T5 time:hasEnd time:tj}})或statement=({<subject>-><property>-><project>},{{time:T5 time:after time:ti}∩{time:T5 time:before time:tj}});
S323:所有在T中的资源,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{T})。
进一步地,所述步骤S3包括以地质时期划分时间的资源描述,其过程是:
S331:根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的地质时期,Utime为String类型;
S332:多个不同地质时期的资源,根据(1-2-2)的划分方法,它们的具名图的URI描述“三元组”表示为Utime=({time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间})或Utime=({time:地质时期time:after time:起始时间}∩{time:地质时期time:before time:结束时间}),将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{{time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间}})或statement=({<subject>-><property>-><project>},{{time:地质时期time:after time:起始时间}∩{time:地质时期time:before time:结束时间}});
S333:所有地质时期的集合定义为T,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{T})。
进一步地,所述步骤S3包括携带时长的资源描述,其过程是:
S341:针对每个需要描述时长的资源定义具名图,为具名图加入URI描述Utime,该URI中存放的是时长的具体的数量;
S342:根据步骤S15,得到该具名图的“三元组”表示为Statement=({<subject>-><property>-><project>},{time:时间长度time:hasDuration time:value})。
进一步地,所述步骤S3包括有格式化时间的资源描述,其过程是:
S351:针对每个需要描述格式化时间的资源定义具名图,为具名图加入URI描述Utime,该URI中存放的是格式化后的时间;
S352:根据步骤S16,可以得到该具名图的“三元组”表示为Statement=({<subject>-><property>-><project>},{time:具体的格式化时间time:hasGeneralDurationDescription time:Format time})。
进一步地,所述步骤S4的过程是:
S41:若所需要描述的资源均有时间属性,仅需要使用SPARQL读取相对应的具名图,得到不同资源在不同时间里的变化情况,实现时间演化;
S42:若所需要描述的资源还有部分不携带时空属性,则将相对应的资源放入默认的Default Graph中,可使用SPARQL读取相对应的具名图+Default Graph来获取更全面的资源。
与现有技术相比,本发明技术方案的有益效果是:
本发明方法首先,根据需要划分好不同的时间段或时间点。然后,通过具名图来为知识图谱中原有的“三元组”加入一个具名图,向不同具名图添加“三元组”和它所对应的时间,得到一个携带时间描述的“四元组”,格式为(<subject>-><predicate>-><object>,{time})。知识图谱就可以根据读取不同的图来展示不同时空里的同一“三元组”,实现时空演化效果。
附图说明
图1为本发明方法的流程图。
具体实施方式
附图仅用于示例性说明,不能理解为对本专利的限制;
为了更好说明本实施例,附图某些部件会有省略、放大或缩小,并不代表实际产品的尺寸;
对于本领域技术人员来说,附图中某些公知结构及其说明可能省略是可以理解的。
下面结合附图和实施例对本发明的技术方案做进一步的说明。
实施例1
如图1所示,一种基于具名图的知识图谱时间演化方法,其具体过程如下:
(1)构建一个知识图谱K
(1-1)为知识图谱构建时间类,获得时间集合(包括时间点、时间段和地质时期的集合)T。
(1-2)根据需要定义时间集合的种类(包括时间点、具体的时间段、地质时期和持续时间),用来表示时间维度的时间实体都有hasTRS:TRS属性,该属性可以为实体加入String格式的字符串或者表示日期的纯数字,为TRS属性添加时间属性值。
(1-2-1)以时间点进行时间划分,某时间点t1在时间集合T中,即t1∈T。为时间实体的TRS属性添加一个纯数字时间属性值——时间点t1。在时间点t1之前的时间拥有time:before属性,时间点的集合为d1before。在时间点t1之后的时间拥有time:after属性,时间点的集合为d1after。
(1-2-2)以某一段时间范围t2~t3划分出时间段T4,且T4∈T。首先确定不同时间段的准确起始时间点,时间段的起始属性为time:hasBeginning,时间段的结束属性为time:hasEnd。结合(1-2-1)中根据时间点划分时间的方法,该时间段的三元组表示为({time:T4time:hasBeginning time:t2},{time:T4 time:hasEnd time:t3}),该时间段的集合可表示为T4=[d2after,d3before]。如时间段T4中不包含起始时间点和结束时间点,根据(1-2-1)的时间点划分方法,该时间段的三元组表示为({time:T4 time:after time:t2}∩{time:T4time:before time:t3}),则表示为T4={d2after,d3before}。
(1-2-3)以地质时期进行划分,如朝代名称等。为时间实体的TRS加入一串字符串(本体URI+地质时期),代表该地质时期。根据(1-2-2)中时间段的划分方法,该地质时期的“三元组”表示是“{time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间}”或“{time:地质时期time:after time:起始时间}∩{time:地质时期time:before time:结束时间}”。
(1-2-4)为三元组添加时长描述,可以通过time:hasDuration属性为时间实体添加时长,这个时长可以是具体的数量,比如1年、6个月、2天、15小时等。该三元组表示为“time:TemporalEntity time:hasDuration time:value”。
(1-2-5)为三元组添加已被格式化后的日历或时钟格式的具体时间(包括年、月、日、周、时、分、秒),可以通过time:hasGeneralDurationDescription属性为时间实体添加具体的格式化时间,该三元组表示为“time:TemporalEntity time:hasGeneralDurationDescription time:Format time”。
(2)划分知识图谱。
(2-1)将已有的知识图谱K,另外根据需要进行手动划分。
(2-1-1)根据时间点划分原则进行划分,根据知识图谱中涵盖的n个时间点划分n个知识图谱,不同时间点的知识图谱仅存有该时间点拥有的资源。
(2-1-2)根据时间段划分原则进行划分,根据知识图谱中涵盖的ni个连续的时间点组成的n0-j段时间段(j≤i),不同的时间段中存有该时间段里多个时间点的所有资源。
(2-1-3)根据地质时期划分原则进行划分,根据知识图谱中所包含的地质时期(String类型)个体,每个地质时期个体都是涵盖了ni个连续的时间点组成的n0-j段时间段(j≤i),不同的地质时期中存有该时间段里多个时间点的所有资源。
(2-2)复制多个相同的知识图谱,分别命名为K1,K2,K3,……,Kn。
(2-3)根据需要所对应的时间原则划分好知识图谱的后,将属于不同时间的资源分别放入K1,K2,K3,……,Kn中。
(3)构建具名图
(3-1)以时间点划分时间的资源描述
(3-1-1)根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的时间点,Utime∈T。(3-1-2)多个不同时间点t5的资源,它们的具名图的URI描述Utime={t1,t2,t3,……,tn},将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中。具名图中的四元组表示为statement=({<subject>-><property>-><project>},{ti})。
(3-1-3)所有在T中的资源,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中。具名图中的四元组表示为statement=({<subject>-><property>-><project>},{t1,t2,t3,……,tn})。
(3-2)以时间段划分时间的资源描述
(3-2-1)根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的时间点,Utime∈T。
(3-2-2)多个不同时间段T5的资源,根据(1-2-2)的划分方法,它们的具名图的URI描述Utime=({time:T5 time:hasBeginning time:ti},{time:T5 time:hasEnd time:tj})或Utime=({time:T5 time:after time:ti}∩{time:T5 time:before time:tj}),将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中。具名图中的四元组表示为statement=({<subject>-><property>-><project>},{{time:T5 time:hasBeginningtime:ti},{time:T5 time:hasEnd time:tj}})或statement=({<subject>-><property>-><project>},{{time:T5 time:after time:ti}∩{time:T5 time:before time:tj}})。
(3-2-3)所有在T中的资源,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中。具名图中的四元组表示为statement=({<subject>-><property>-><project>},{T})。
(3-3)以地质时期划分时间的资源描述
(3-3-1)根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的地质时期,Utime为String类型。
(3-3-2)多个不同地质时期的资源,根据(1-2-2)的划分方法,它们的具名图的URI描述“三元组”表示为Utime=({time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间})或Utime=({time:地质时期time:aftertime:起始时间}∩{time:地质时期time:before time:结束时间}),将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中。具名图中的四元组表示为statement=({<subject>-><property>-><project>},{{time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间}})或statement=({<subject>-><property>-><project>},{{time:地质时期time:after time:起始时间}∩{time:地质时期time:before time:结束时间}})。
(3-3-3)所有地质时期的集合定义为T,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中。具名图中的四元组表示为:
statement=({<subject>-><property>-><project>},{T})。
(3-4)携带时长的资源描述
(3-4-1)针对每个需要描述时长的资源定义具名图,为具名图加入URI描述Utime,该URI中存放的是时长的具体的数量。
(3-4-2)根据(1-2-4),可以得到该具名图的“三元组”表示为:
Statement=({<subject>-><property>-><project>},{time:时间长度time:hasDuration time:value})。
(3-5)有格式化时间的资源描述
(3-5-1)针对每个需要描述格式化时间的资源定义具名图,为具名图加入URI描述Utime,该URI中存放的是格式化后的时间(如日历、钟表格式)。
(3-5-2)根据(1-2-5),可以得到该具名图的“三元组”表示为Statement=({<subject>-><property>-><project>},{time:具体的格式化时间time:hasGeneralDurationDescription time:Format time})。
(4)利用SPARQL读取不同时间点(段)的具名图。
(4-1)若所需要描述的资源均有时间属性,仅需要使用SPARQL读取相对应的具名图,得到不同资源在不同时间里的变化情况,实现时间演化。
(4-2)若所需要描述的资源还有部分不携带时空属性,则将相对应的资源放入默认的Default Graph中,可使用SPARQL读取相对应的具名图+Default Graph来获取更全面的资源。
以马应彪和先施公司的三元组关系为例实施时间点、时间段的演化以及持续时间的表示。
时间点演化:
马应彪在1900年,创办了先施公司。在1917年,创办了先施公司上海分公司。
Graph1=({马应彪->创办->先施公司},{1900年})
Graph2=({马应彪->创办->先施公司上海分公司},{1917年})
时间段演化:
马应彪在1900年至1936年期间,经营管理先施公司。而马应彪的后人马景华在2003年至2011年期间继续经营管理先施公司。Graph3=({马应彪->经营管理->先施公司},{{time:时间段time:hasBeginning time:1900},{time:时间段time:hasEnd time:1936}})
Graph4=({马景华->经营管理->先施公司},{{time:时间段time:hasBeginningtime:2003},{time:时间段time:hasEnd time:2011}})
持续时间:
马应彪在1900年至1936年期间,经营管理先施公司。
Graph5=({马应彪->经营管理->先施公司},{time:经营时长time:hasDurationtime:36年})
以中国的首都在不同地质时期的变化为例实施地质时期的演化。
地质时期:
中国在夏朝时期的首都是洛阳,在清朝时期的首都是北京。
Graph6=({中国->首都是->洛阳},{{time:夏朝time:hasBeginning time:公元前21世纪},{time:夏朝time:hasEnd time:公元前16世纪}})
Graph7=({中国->首都是->北京},{{time:清朝time:hasBeginning time:1644年},{time:清朝time:hasEnd time:1912年}})
以小明面试腾讯公司的面试时间描述面试资源展示格式化时间。
小明于2017年5月14日面试了腾讯公司。
Graph8=({小明->面试->腾讯公司},{{time:2017年5月14日time:hasGeneralDurationDescription year:2017},{time:2017年5月14日time:hasGeneralDurationDescription month:5},{time:2017年5月14日time:hasGeneralDurationDescription day:14}})
相同或相似的标号对应相同或相似的部件;
附图中描述位置关系的用于仅用于示例性说明,不能理解为对本专利的限制;
显然,本发明的上述实施例仅仅是为清楚地说明本发明所作的举例,而并非是对本发明的实施方式的限定。对于所属领域的普通技术人员来说,在上述说明的基础上还可以做出其它不同形式的变化或变动。这里无需也无法对所有的实施方式予以穷举。凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明权利要求的保护范围之内。
Claims (9)
1.一种基于具名图的知识图谱时间演化方法,其特征在于,包括以下步骤:
S1:构建一个知识图谱K;
S2:将得到的知识图谱K进行手动划分;
S3:利用划分的知识图谱构建具名图;
S4:使用SPARQL读取具名图来获取更全面的资源。
2.根据权利要求1所述的基于具名图的知识图谱时间演化方法,其特征在于,所述步骤S1的具体过程如下:
S11:为知识图谱构建时间类,获得时间集合T,该集合包括时间点、时间段和地质时期,其中,用来表示时间维度的时间实体都有hasTRS:TRS属性,该属性为实体加入String格式的字符串或者表示日期的纯数字,为TRS属性添加时间属性值;
S12:以时间点进行时间划分,某时间点t1在时间集合T中,即t1∈T,为时间实体的TRS属性添加一个纯数字时间属性值——时间点t1,在时间点t1之前的时间拥有time:before属性,时间点的集合为d1before,在时间点t1之后的时间拥有time:after属性,时间点的集合为d1after;
S13:以某一段时间范围t2~t3划分出时间段T4,且T4∈T,首先确定不同时间段的准确起始时间点,时间段的起始属性为time:hasBeginning,时间段的结束属性为time:hasEnd,结合S12中根据时间点划分时间的方法,该时间段的三元组表示为({time:T4 time:hasBeginning time:t2},{time:T4 time:hasEnd time:t3}),该时间段的集合可表示为T4=[d2after,d3before],若时间段T4中不包含起始时间点和结束时间点,根据S12的时间点划分方法,该时间段的三元组表示为({time:T4 time:after time:t2}∩{time:T4 time:beforetime:t3}),则表示为T4={d2after,d3before};
S14:以地质时期进行划分,包括朝代名称,为时间实体的TRS加入一串字符串,代表该地质时期,根据S13中时间段的划分方法,该地质时期的“三元组”表示是“{time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间}”或“{time:地质时期time:after time:起始时间}∩{time:地质时期time:before time:结束时间}”;
S15:为三元组添加时长描述,通过time:hasDuration属性为时间实体添加时长,这个时长是具体的数量,包括1年、6个月、2天、15小时,该三元组表示为“time:TemporalEntitytime:hasDuration time:value”;
S16:为三元组添加已被格式化后的日历或时钟格式的具体时间包括年、月、日、周、时、分、秒,通过time:hasGeneralDurationDescription属性为时间实体添加具体的格式化时间,该三元组表示为“time:TemporalEntity time:hasGeneralDurationDescriptiontime:Format time”。
3.根据权利要求2所述的基于具名图的知识图谱时间演化方法,其特征在于,所述步骤S2的具体过程如下:
S21:根据时间点划分原则进行划分,根据知识图谱中涵盖的n个时间点划分n个知识图谱,不同时间点的知识图谱仅存有该时间点拥有的资源;
S22:根据时间段划分原则进行划分,根据知识图谱中涵盖的ni个连续的时间点组成的n0-j段时间段(j≤i),不同的时间段中存有该时间段里多个时间点的所有资源;
S23:根据地质时期划分原则进行划分,根据知识图谱中所包含的地质时期(String类型)个体,每个地质时期个体都是涵盖了ni个连续的时间点组成的n0-j段时间段(j≤i),不同的地质时期中存有该时间段里多个时间点的所有资源;
S24:复制多个相同的知识图谱,分别命名为K1,K2,K3,……,Kn;
S25:根据需要所对应的时间原则划分好知识图谱的后,将属于不同时间的资源分别放入K1,K2,K3,……,Kn中。
4.根据权利要求3所述的基于具名图的知识图谱时间演化方法,其特征在于,所述步骤S3包括以时间点划分时间的资源描述,其过程是:
S311:根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的时间点,Utime∈T;
S312:多个不同时间点t5的资源,它们的具名图的URI描述Utime={t1,t2,t3,……,tn},将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{ti});
S313:所有在T中的资源,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{t1,t2,t3,……,tn})。
5.根据权利要求4所述的基于具名图的知识图谱时间演化方法,其特征在于,所述步骤S3包括以时间段划分时间的资源描述,其过程是:
S321:根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的时间点,Utime∈T;
S322:多个不同时间段T5的资源,根据(1-2-2)的划分方法,它们的具名图的URI描述Utime=({time:T5 time:hasBeginning time:ti},{time:T5 time:hasEnd time:tj})或Utime=({time:T5 time:after time:ti}∩{time:T5time:before time:tj}),将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{{time:T5time:hasBeginningtime:ti},{time:T5 time:hasEnd time:tj}})或statement=({<subject>-><property>-><project>},{{time:T5time:after time:ti}∩{time:T5time:before time:tj}});
S323:所有在T中的资源,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{T})。
6.根据权利要求5所述的基于具名图的知识图谱时间演化方法,其特征在于,所述步骤S3包括以地质时期划分时间的资源描述,其过程是:
S331:根据需求定义多个具名图G1,G2,G3,……,Gn以及一个默认具名图Gall,为每个具名图都加入一组URI描述Utime,用以描述具名图所代表的地质时期,Utime为String类型;
S332:多个不同地质时期的资源,根据(1-2-2)的划分方法,它们的具名图的URI描述“三元组”表示为Utime=({time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间})或Utime=({time:地质时期time:after time:起始时间}∩{time:地质时期time:before time:结束时间}),将需要描述的“三元组”资源{<subject>-><property>-><project>}分别加入K1,K2,K3,……,Kn,与{Utime}一起加入属于该时间点之前的具名图G1,G2,G3,……,Gn中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{{time:地质时期time:hasBeginning time:起始时间},{time:地质时期time:hasEnd time:结束时间}})或statement=({<subject>-><property>-><project>},{{time:地质时期time:after time:起始时间}∩{time:地质时期time:before time:结束时间}});
S333:所有地质时期的集合定义为T,该具名图的URI描述Utime=T,将需要描述的“三元组”资源K,与T一起加入属于所有时间点的具名图Gall中,具名图中的四元组表示为statement=({<subject>-><property>-><project>},{T})。
7.根据权利要求6所述的基于具名图的知识图谱时间演化方法,其特征在于,所述步骤S3包括携带时长的资源描述,其过程是:
S341:针对每个需要描述时长的资源定义具名图,为具名图加入URI描述Utime,该URI中存放的是时长的具体的数量;
S342:根据步骤S15,得到该具名图的“三元组”表示为Statement=({<subject>-><property>-><project>},{time:时间长度time:hasDuration time:value})。
8.根据权利要求7所述的基于具名图的知识图谱时间演化方法,其特征在于,所述步骤S3包括有格式化时间的资源描述,其过程是:
S351:针对每个需要描述格式化时间的资源定义具名图,为具名图加入URI描述Utime,该URI中存放的是格式化后的时间;
S352:根据步骤S16,可以得到该具名图的“三元组”表示为Statement=({<subject>-><property>-><project>},{time:具体的格式化时间time:hasGeneralDurationDescription time:Format time})。
9.根据权利要求8所述的基于具名图的知识图谱时间演化方法,其特征在于,所述步骤S4的过程是:
S41:若所需要描述的资源均有时间属性,仅需要使用SPARQL读取相对应的具名图,得到不同资源在不同时间里的变化情况,实现时间演化;
S42:若所需要描述的资源还有部分不携带时空属性,则将相对应的资源放入默认的Default Graph中,可使用SPARQL读取相对应的具名图+Default Graph来获取更全面的资源。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710620086.1A CN107463649A (zh) | 2017-07-26 | 2017-07-26 | 一种基于具名图的知识图谱时间演化方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710620086.1A CN107463649A (zh) | 2017-07-26 | 2017-07-26 | 一种基于具名图的知识图谱时间演化方法 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN107463649A true CN107463649A (zh) | 2017-12-12 |
Family
ID=60547413
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710620086.1A Pending CN107463649A (zh) | 2017-07-26 | 2017-07-26 | 一种基于具名图的知识图谱时间演化方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107463649A (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019911A (zh) * | 2017-12-29 | 2019-07-16 | 苏州工业职业技术学院 | 支持知识演化的知识图谱的查询方法和装置 |
CN111414484A (zh) * | 2020-03-04 | 2020-07-14 | 科大讯飞(苏州)科技有限公司 | 有效时段信息确定方法、装置、电子设备和存储介质 |
CN111694943A (zh) * | 2020-05-29 | 2020-09-22 | 刘韩 | 一种精准信息查询方法及系统 |
CN112329810A (zh) * | 2020-09-28 | 2021-02-05 | 北京师范大学 | 一种基于显著性检测的图像识别模型训练方法及装置 |
CN112699252A (zh) * | 2021-03-25 | 2021-04-23 | 成都数联铭品科技有限公司 | 应用于知识图谱的属性数据的处理方法及电子设备 |
CN112905805A (zh) * | 2021-03-05 | 2021-06-04 | 北京中经惠众科技有限公司 | 知识图谱构建方法及装置、计算机设备和存储介质 |
CN113051404A (zh) * | 2021-01-08 | 2021-06-29 | 中国科学院自动化研究所 | 一种基于张量分解的知识推理方法、装置、设备 |
CN113806555A (zh) * | 2021-09-14 | 2021-12-17 | 国网北京市电力公司 | 用于app的运营异常识别方法、系统、装置及存储介质 |
-
2017
- 2017-07-26 CN CN201710620086.1A patent/CN107463649A/zh active Pending
Cited By (14)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110019911A (zh) * | 2017-12-29 | 2019-07-16 | 苏州工业职业技术学院 | 支持知识演化的知识图谱的查询方法和装置 |
CN111414484A (zh) * | 2020-03-04 | 2020-07-14 | 科大讯飞(苏州)科技有限公司 | 有效时段信息确定方法、装置、电子设备和存储介质 |
CN111414484B (zh) * | 2020-03-04 | 2021-05-28 | 科大讯飞(苏州)科技有限公司 | 有效时段信息确定方法、装置、电子设备和存储介质 |
CN111694943A (zh) * | 2020-05-29 | 2020-09-22 | 刘韩 | 一种精准信息查询方法及系统 |
CN112329810B (zh) * | 2020-09-28 | 2023-07-11 | 北京师范大学 | 一种基于显著性检测的图像识别模型训练方法及装置 |
CN112329810A (zh) * | 2020-09-28 | 2021-02-05 | 北京师范大学 | 一种基于显著性检测的图像识别模型训练方法及装置 |
CN113051404B (zh) * | 2021-01-08 | 2024-02-06 | 中国科学院自动化研究所 | 一种基于张量分解的知识推理方法、装置、设备 |
CN113051404A (zh) * | 2021-01-08 | 2021-06-29 | 中国科学院自动化研究所 | 一种基于张量分解的知识推理方法、装置、设备 |
CN112905805A (zh) * | 2021-03-05 | 2021-06-04 | 北京中经惠众科技有限公司 | 知识图谱构建方法及装置、计算机设备和存储介质 |
CN112905805B (zh) * | 2021-03-05 | 2023-09-15 | 北京中经惠众科技有限公司 | 知识图谱构建方法及装置、计算机设备和存储介质 |
CN112699252B (zh) * | 2021-03-25 | 2021-07-23 | 成都数联铭品科技有限公司 | 应用于知识图谱的属性数据的处理方法及电子设备 |
CN112699252A (zh) * | 2021-03-25 | 2021-04-23 | 成都数联铭品科技有限公司 | 应用于知识图谱的属性数据的处理方法及电子设备 |
CN113806555A (zh) * | 2021-09-14 | 2021-12-17 | 国网北京市电力公司 | 用于app的运营异常识别方法、系统、装置及存储介质 |
CN113806555B (zh) * | 2021-09-14 | 2023-08-08 | 国网北京市电力公司 | 用于app的运营异常识别方法、系统、装置及存储介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107463649A (zh) | 一种基于具名图的知识图谱时间演化方法 | |
Zeng | Family dynamics in China: A life table analysis | |
Beisert et al. | A quantum affine algebra for the deformed Hubbard chain | |
CN109448703A (zh) | 结合深度神经网络和主题模型的音频场景识别方法及系统 | |
Zhao et al. | Does the digital economy increase green TFP in cities? | |
Vaz et al. | Automated big-o analysis of algorithms | |
CN114117065A (zh) | 基于电力生产统计业务的知识图谱构建方法及系统 | |
Sarjoughian et al. | Standardizing DEVS models: an endogenous standpoint | |
Monsell | The X-13A-S seasonal adjustment program | |
Zhang et al. | Dynamic evaluation and internal driving factors of water resources green efficiency in China | |
CN103544338A (zh) | 一种面向三维装配指令发布的工艺信息建模方法 | |
Alemany et al. | Continuous symmetry measures of irreducible representations: application to molecular orbitals | |
Jacobson | Context and the sociological study of stress | |
Filipova et al. | Definition of the criteria for layout of the UML use case diagrams | |
Nieuwenhuis et al. | Employee scheduling with SAT-based pseudo-Boolean constraint solving | |
Diaz-Lopez et al. | Peaks on Graphs | |
Kendall et al. | Towards a commercial ontology development environment | |
Li et al. | A Study on Data-Driven Product Innovation Model | |
Yarushkina et al. | Using ontology merging for the integration of information systems and the production capacity planning system | |
CN112286926B (zh) | 一种基于办事事项数据供需图谱梳理数据质量规则的方法 | |
Yazici et al. | Normalizing relational database schemas using mathematica | |
Sun et al. | A practical yet accurate real-time statistical analysis library for hydrologic time-series big data | |
Zhang | The research on multimedia software engineering based on software life cycle | |
Guéret et al. | Genericity versus expressivity-an exercise in semantic interoperable research information systems for Web Science | |
Börner | Mapping science |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
WD01 | Invention patent application deemed withdrawn after publication | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20171212 |