CN109033208B - 本体构建方法及装置 - Google Patents

本体构建方法及装置 Download PDF

Info

Publication number
CN109033208B
CN109033208B CN201810701221.XA CN201810701221A CN109033208B CN 109033208 B CN109033208 B CN 109033208B CN 201810701221 A CN201810701221 A CN 201810701221A CN 109033208 B CN109033208 B CN 109033208B
Authority
CN
China
Prior art keywords
attribute information
instance attribute
ontology
objects
time
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201810701221.XA
Other languages
English (en)
Other versions
CN109033208A (zh
Inventor
姜伟浩
葛挺
邵勇
闫春
浦世亮
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hangzhou Hikvision Digital Technology Co Ltd
Original Assignee
Hangzhou Hikvision Digital Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hangzhou Hikvision Digital Technology Co Ltd filed Critical Hangzhou Hikvision Digital Technology Co Ltd
Priority to CN201810701221.XA priority Critical patent/CN109033208B/zh
Publication of CN109033208A publication Critical patent/CN109033208A/zh
Priority to PCT/CN2019/093683 priority patent/WO2020001616A1/zh
Application granted granted Critical
Publication of CN109033208B publication Critical patent/CN109033208B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/23Updating
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Quality & Reliability (AREA)
  • Computational Linguistics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种本体构建方法及装置,属于本体构建技术领域。所述方法包括:对指定的数据集合进行实例化处理,得到多个对象中每个对象的实例属性信息;其中,所述每个对象的实例属性信息包括:所述每个对象在时间维度上的时维属性信息;按照指定的存储结构,存储所述多个对象的实例属性信息,以构建所述本体。本申请解决了本体的准确度较低的问题,提高了本体的准确度,本申请用于本体构建。

Description

本体构建方法及装置
技术领域
本申请涉及计算机技术领域,特别涉及一种本体构建方法及装置。
背景技术
本体是对真实世界中的实体(如人或物)、实体涉及的事件以及实体之间的关系的描述,人们可以在本体中对被本体描述的对象进行查询。
示例的,本体描述的每个对象均具有多种属性信息,如人的属性信息包括:姓名、性别和身份证号等。本体可以通过记载对象的属性信息对该对象进行描述。相关技术中,在构建本体时,计算机设备需要对指定的数据集合进行实例化处理,从而得到每个对象(如实体、事件或关系)的实例属性信息,并将每个对象的实例属性信息进行存储。
但是,相关技术中本体描述的对象通常是固定不变的,而部分对象在真实世界中却是变化的(如实体之间的关系会改变),因此,相关技术中本体的准确度较低。
发明内容
本申请提供了一种本体构建方法及装置,可以解决本体的准确度较低的问题,所述技术方案如下:
第一方面,提供了一种本体构建方法,所述方法包括:
对指定的数据集合进行实例化处理,得到多个对象中每个对象的实例属性信息;其中,所述每个对象的实例属性信息包括:所述每个对象在时间维度上的时维属性信息;
按照指定的存储结构,存储所述多个对象的实例属性信息,以构建所述本体。
可选的,所述多个对象中存在至少一个为实体的对象,所述实体的时维属性信息包括:
用于记载所述实体是否消亡的存续标识;
和/或,所述实体的诞生时间的指示信息;
和/或,所述实体的消亡时间的指示信息;
和/或,所述实体的存续事件标识,所述存续事件标识用于记载所述实体的时维属性信息发生变化的触发事件。
可选的,所述存储所述多个对象的实例属性信息,包括:
对于所述多个对象的实例属性信息中,第i个实体的实例属性信息,检测本地是否存储有所述第i个实体的历史实例属性信息,1≤i≤k,k为所述多个对象中实体的个数;
在本地存储有与所述第i个实体的历史实例属性信息时,采用所述第i个实体的实例属性信息覆盖其历史实例属性信息。
可选的,所述多个对象中存在至少一个为关系的对象,所述关系为实体间的关系,所述关系的时维属性信息包括:
所述关系的版本标识,其中,每个所述关系具有至少一个版本标识,每个所述版本标识唯一对应所述关系所维持的一个时间段;
和/或,所述关系的起始时间的指示信息;
和/或,所述关系的结束时间的指示信息;
和/或,所述关系的来源事件标识,所述来源事件标识用于记载与所述关系的每个版本标识相关的事件。
可选的,所述存储所述多个对象的实例属性信息,包括:
对于所述多个对象的实例属性信息中,第h个关系的实例属性信息,确定本地存储的所述第h个关系的历史实例属性信息的个数,1≤h≤p,p为所述多个对象中关系的个数;
判断本地存储的所述第h个关系的历史实例属性信息的个数是否大于预设个数阈值;
在本地存储的所述第h个关系的历史实例属性信息的个数大于所述预设个数阈值时,将本地存储的所述第h个关系的可清理历史实例属性信息移动至外设回收站,以使得所述第h个关系的剩余历史实例属性信息的个数小于或等于所述预设个数阈值;
存储第h个关系的实例属性信息。
可选的,所述剩余历史实例属性信息中的关系版本为剩余关系版本,所述可清理历史实例属性信息中的关系版本为可清理关系版本;
所述剩余关系版本所对应的时间段在所述可清理关系版本所对应的时间段之后。
可选的,在所述对指定的数据集合进行实例化处理之前,所述方法还包括:获取本体模板和实例化规则,其中,所述本体模板用于记载多个对象组的属性信息,每个对象组中包括属于同一类型的对象,所述多个对象组以层级的形式关联;
所述对指定的数据集合进行实例化处理,包括:根据所述本体模板和所述实例化规则,对所述数据集合进行所述实例化处理;
其中,所述多个对象中每个对象的实例属性信息为基于所述本体模板所记载的属性信息,在所述数据集合中提取的信息。
可选的,在存储所述多个对象的实例属性信息之后,所述方法还包括:
分别检测所述本体模板、所述实例化规则以及所述数据集合是否更新;
当所述本体模板、所述实例化规则以及所述数据集合中的至少一个更新时,根据当前的本体模板和当前的实例化规则对待处理数据进行实例化处理,以得到多个更新对象的实例属性信息,其中,所述待处理数据为当前的数据集合中所述当前的实例化规则所指示的待进行实例化处理的数据;
将所述多个更新对象的实例属性信息覆盖已存储的实例属性信息,以更新所述本体。
可选的,在基于所述多个对象的实例属性信息构建所述本体之后,所述方法还包括:
获取目标查询条件,所述目标查询条件包括:时间条件;
根据所述目标查询条件,查询所述本体中是否存在满足所述目标查询条件的目标实例属性信息;
在所述本体中存在所述目标实例属性信息时,获取所述目标实例属性信息。
可选的,所述获取目标查询条件,包括:
接收初始查询条件;
判断所述初始查询条件是否包括所述时间条件;
在所述初始查询条件包括所述时间条件时,确定所述初始查询条件为所述目标查询条件;
在所述初始查询条件不包括所述时间条件时,将预设的时间条件加入所述初始查询条件,以得到所述目标查询条件。
可选的,所述方法还包括:
在所述本体不包括所述目标实例属性信息时,查询外设回收站中是否存在所述目标实例属性信息;
在所述外设回收站中存在所述目标实例属性信息时,执行获取所述目标实例属性信息的步骤;
在所述外设回收站中不存在所述目标实例属性信息时,根据当前的本体模板和当前的实例化规则对所述数据集合中的目标数据进行实例化处理,以得到所述目标实例属性信息;
其中,所述时间条件用于记载指定时间段,所述目标数据为所述数据集合中在所述指定时间段内生成的数据。
第二方面,提供了一种本体构建装置,所述本体构建装置包括:
第一处理模块,用于对指定的数据集合进行实例化处理,得到多个对象中每个对象的实例属性信息;
存储模块,用于按照指定的存储结构,存储所述多个对象的实例属性信息,以构建所述本体;
其中,所述每个对象的实例属性信息包括:所述每个对象在时间维度上的时维属性信息。
可选的,所述多个对象中存在至少一个为实体的对象,所述实体的时维属性信息包括:
用于记载所述实体是否消亡的存续标识;
和/或,所述实体的诞生时间的指示信息;
和/或,所述实体的消亡时间的指示信息;
和/或,所述实体的存续事件标识,所述存续事件标识用于记载所述实体的时维属性信息发生变化的触发事件。
可选的,所述存储模块用于:
对于所述多个对象的实例属性信息中,第i个实体的实例属性信息,检测本地是否存储有所述第i个实体的历史实例属性信息,1≤i≤k,k为所述多个对象中实体的个数;
在本地存储有与所述第i个实体的历史实例属性信息时,采用所述第i个实体的实例属性信息覆盖其历史实例属性信息。
可选的,所述多个对象中存在至少一个为关系的对象,所述关系为实体间的关系,所述关系的时维属性信息包括:
所述关系的版本标识,其中,每个所述关系具有至少一个版本标识,每个所述版本标识唯一对应所述关系所维持的一个时间段;
和/或,所述关系的起始时间的指示信息;
和/或,所述关系的结束时间的指示信息;
和/或,所述关系的来源事件标识,所述来源事件标识用于记载与所述关系的每个版本标识相关的事件。
可选的,所述存储模块用于:
对于所述多个对象的实例属性信息中,第h个关系的实例属性信息,确定本地存储的所述第h个关系的历史实例属性信息的个数,1≤h≤p,p为所述多个对象中关系的个数;
判断本地存储的所述第h个关系的历史实例属性信息的个数是否大于预设个数阈值;
在本地存储的所述第h个关系的历史实例属性信息的个数大于所述预设个数阈值时,将本地存储的所述第h个关系的可清理历史实例属性信息移动至外设回收站,以使得所述第h个关系的剩余历史实例属性信息的个数小于或等于所述预设个数阈值;
存储第h个关系的实例属性信息。
可选的,所述剩余历史实例属性信息中的关系版本为剩余关系版本,所述可清理历史实例属性信息中的关系版本为可清理关系版本;
所述剩余关系版本所对应的时间段在所述可清理关系版本所对应的时间段之后。
可选的,所述本体构建装置还包括:
第一获取模块,用于获取本体模板和实例化规则,其中,所述本体模板用于记载多个对象组的属性信息,每个对象组中包括属于同一类型的对象,所述多个对象组以层级的形式关联;
所述第一处理模块用于:根据所述本体模板和所述实例化规则,对所述数据集合进行所述实例化处理;
其中,所述多个对象中每个对象的实例属性信息为基于所述本体模板所记载的属性信息,在所述数据集合中提取的信息。
可选的,所述本体构建装置还包括:
检测模块,用于分别检测所述本体模板、所述实例化规则以及所述数据集合是否更新;
第二处理模块,用于在所述本体模板、所述实例化规则以及所述数据集合中的至少一个更新时,根据当前的本体模板和当前的实例化规则对待处理数据进行实例化处理,以得到多个更新对象的实例属性信息,其中,所述待处理数据为当前的数据集合中所述当前的实例化规则所指示的待进行实例化处理的数据;
覆盖模块,用于将所述多个更新对象的实例属性信息覆盖已存储的实例属性信息,以更新所述本体。
可选的,所述本体构建装置还包括:
第二获取模块,用于获取目标查询条件,所述目标查询条件包括:时间条件;
第一查询模块,用于根据所述目标查询条件,查询所述本体中是否存在满足所述目标查询条件的目标实例属性信息;
第三获取模块,用于在所述本体中存在所述目标实例属性信息时,获取所述目标实例属性信息。
可选的,所述第二获取模块用于:
接收初始查询条件;
判断所述初始查询条件是否包括所述时间条件;
在所述初始查询条件包括所述时间条件时,确定所述初始查询条件为所述目标查询条件;
在所述初始查询条件不包括所述时间条件时,将预设的时间条件加入所述初始查询条件,以得到所述目标查询条件。
可选的,所述本体构建装置还包括:
第二查询模块,用于在所述本体不包括所述目标实例属性信息时,查询外设回收站中是否存在所述目标实例属性信息;
所述第三获取模块还用于在所述外设回收站中存在所述目标实例属性信息时,执行获取所述目标实例属性信息的步骤;
第三处理模块,用于在所述外设回收站中不存在所述目标实例属性信息时,根据当前的本体模板和当前的实例化规则对所述数据集合中的目标数据进行实例化处理,以得到所述目标实例属性信息;
其中,所述时间条件用于记载指定时间段,所述目标数据为所述数据集合中在所述指定时间段内生成的数据。
第三方面,提供了一种计算机设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现第一方面所述的方法。
第四方面,提供了一种计算机可读存储介质,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现第一方面所述的方法。
由于本发明实施例得到的实例属性信息包括时间维度的时维属性信息,因此,基于该实例属性信息构建的本体能够描述对象与时间的关系,这样一来,本体描述的对象能够与真实世界中的对象统一,提高了本体的准确度。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种本体构建方法的方法流程图;
图2为本发明实施例提供的另一种本体构建方法的方法流程;
图3为本发明实施例提供的一种本体模板的示意图;
图4为本发明实施例提供的另一种本体模板的示意图;
图5为本发明实施例提供的一种获取本体模板的方法流程图;
图6为本发明实施例提供的一种本体构建装置的结构示意图;
图7为本发明实施例提供的另一种本体构建装置的结构示意图。
具体实施方式
为使本申请的目的、技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述。
本体是对真实世界中的实体、实体涉及的事件以及实体之间的关系的描述,该实体、事件和关系均为本体描述的对象。例如,实体可以为学生、老师、警察、车等,实体涉及的事件可以为:学生上课、警察抓小偷等与实体相关的事件,实体之间的关系可以为:学生与老师之间的师生关系等。
本体描述的每个对象(如实体、事件或关系)均具有多种属性。例如,学生的属性包括:姓名、性别、年级和身份证号等,车的属性包括:车的名牌和车牌号等。本体可以通过记载对象的实例属性信息对该对象进行描述。
本发明实施例提供了一种本体构建方法,该方法可以用于计算机设备,该计算机设备可以包括一个设备或多个设备组成的设备集群,本发明实施例对此不作限定。该计算机设备可以包括:处理器、通信接口、存储器和通信总线,其中,处理器、通信接口、存储器通过总线完成相互间的通信;该计算机设备可以通过该通信接口与外部的其他设备通信;存储器可以用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现该本体构建方法。
图1为本发明实施例提供的一种本体构建方法的方法流程图,如图1所示,该本体构建方法可以包括:
步骤101、对指定的数据集合进行实例化处理,得到多个对象中每个对象的实例属性信息。
步骤102、按照指定的存储结构,存储所述多个对象的实例属性信息,以构建所述本体。
其中,所述每个对象的实例属性信息包括:所述每个对象在时间维度上的时维属性信息。
综上所述,由于本发明实施例得到的实例属性信息包括时间维度的时维属性信息,因此,基于该实例属性信息构建的本体能够描述对象与时间的关系,这样一来,本体描述的对象能够与真实世界中的对象统一,提高了本体的准确度。
图2为本发明实施例提供的另一种本体构建方法的方法流程图,如图2所示,该本体构建方法可以包括:
步骤201、获取本体模板和实例化规则。
示例的,该本体模板可以用于记载多个对象组的属性,每个对象组的属性可以包括在时间维度上的时维属性。每个对象组中包括属于同一类型的对象,如:属于学生类型的对象组成的对象组,属于医生类型的对象组成的对象组等,属于亲属关系类型的对象组成的对象组,属于公益事件的对象组成的对象组。
多个对象组以层级的形式关联,对于多个对象组中分别关联且相邻的每两层对象组,下一层对象组的属性包括上一层对象组的属性。也即,下一层对象组具有上一层对象组的属性,该下一层对象组可以称为上一层对象组的子对象组,上一层对象组可以称为下一层对象组的父对象组,下一层对象组继承了上一层对象组的部分属性,顶层对象组可以称为其他层对象组的祖先对象组。如,上一层对象组为人,该下一层对象组可以为学生、警察等。
需要说明的是,本体模板可以通过多种可实现方式对每个对象组的属性信息进行记载,本发明实施例将对其中的两种可实现方式进行解释说明。
在本体模板的一种可实现方式中,本体模板中记载有:每个对象组对应的属性信息,并且每个对象组对应的属性信息为每个对象组的属性信息。
图3为本发明实施例提供的一种本体模板的示意图,如图3所示,该多个对象组可以包括:顶层对象组、人对象组、学生对象组、警察对象组和车对象组。人对象组和车对象组均与顶层对象组关联,且均位于顶层对象组的下一层,学生对象组和警察对象组均与人对象组关联,且均位于人对象组的下一层。顶层对象组位于这些对象组中的顶层,学生对象组、警察对象组以及车对象组均位于这些对象组中的底层,也即,未关联有下一层对象组的对象组为底层对象组。
其中,顶层对象组对应的属性信息包括:身份标识码、名字以及诞生时间,真实世界中的每种对象均为该顶层对象组中的一种类型,如人对象组和车对象组分别为顶层对象组中的两种类型。
人对象组对应的属性信息包括:身份证号码(与顶层对象组对应的属性信息中的身份标识码用于描述同一属性)、出生日期(与顶层对象组对应的属性信息中的诞生时间用于描述同一属性)、名字(与顶层对象组对应的属性信息中的名字相同)、性别(与顶层对象组对应的每个属性信息均用于描述不同的属性)、级别(与顶层对象组对应的每个属性信息均用于描述不同的属性)。
车对象组对应的属性信息包括:车牌号码(与顶层对象组对应的属性信息中的身份标识码用于描述同一属性)、生产日期(与顶层对象组对应的属性信息中的诞生时间用于描述同一属性)、名字(与顶层对象组对应的属性信息中的名字相同)、机动(与顶层对象组对应的每个属性信息均用于描述不同的属性)、品牌(与顶层对象组对应的每个属性信息均用于描述不同的属性)。
人对象组又可以包括:学生对象组和警察对象组这两种类型。
其中,学生对象组对应的属性信息可以包括:身份证号码(与人对象组对应的属性信息中的身份证号码相同)、出生日期(与人对象组对应的属性信息中的出生日期相同)、名字(与人对象组对应的属性信息中的名字相同)、性别(与人对象组对应的属性信息中的性别相同)、年级(与人对象组对应的属性信息中的级别用于描述为同一属性)、学校名称(与人对象组对应的每个属性信息均用于描述不同的属性)。
警察对象组对应的属性信息可以包括:身份证号码(与人对象组对应的属性信息中的身份证号码相同)、出生日期(与人对象组对应的属性信息中的出生日期相同)、名字(与人对象组对应的属性信息中的名字相同)、性别(与人对象组对应的属性信息中的性别相同)、职称(与人对象组对应的属性信息中的级别用于描述同一属性)、所在警局名称(与人对象组对应的每个属性信息均用于描述不同的属性)。
在本体模板的另一种可实现方式中,本体模板中记载有:每个对象组对应的属性信息。并且,多个对象组中顶层对象组的属性信息包括:顶层对象组对应的属性信息;在每两层对象组中,上层对象组的属性信息的类型包括:直接继承类和间接继承类;下层对象组对应的属性信息的类型包括:实现类。上层对象组对应的间接继承类的属性信息与下层对象组对应的实现类的属性信息不同,且用于描述相同的属性;上层对象组对应的直接继承类的属性信息与下层对象组对应的实现类的属性信息用于描述不同的属性。下层对象组的属性信息包括:上层对象组对应的直接继承类的属性信息,以及下层对象组对应的属性信息。
图4为本发明实施例提供的另一种本体模板的示意图,如图4所示,在图3的基础上,对于多个对象组中分别关联且相邻的每两层对象组,当下层对象组对应的某一属性信息与其关联的上层对象组对应的属性信息相同时,该下层对象组对应的属性信息需要删除该某一属性信息,从而能够得到如图4所述的本体模板。
示例的,人对象组的属性信息包括:身份证号码、出生日期、性别、级别,而由于顶层对象组对应的属性信息包括名字,因此人对象组对应的属性信息并不包括:名字。车对象组的属性信息包括:车牌号码、生产日期、机动、品牌,而由于顶层对象组对应的属性信息包括名字,因此车对象组对应的属性信息并不包括:名字。学生对象组的属性信息可以包括:年级、学校名称,而由于人对象组对应的属性信息包括身份证号码、出生日期、名字、性别,因此学生对象组对应的属性信息并不包括:身份证号码、出生日期、名字、性别。警察对象组的属性信息可以包括:职称、所在警局名称,而由于人对象组对应的属性信息包括身份证号码、出生日期、名字、性别,因此警察对象组对应的属性信息并不包括:身份证号码、出生日期、名字、性别。
这样一来,本体模板可以通过记载每个对象组对应的属性信息,对每个对象组的属性信息进行记载,并且每个非顶层对象组的属性信息均可以进行部分省略,从而能够减少本体模板中记载的属性信息,简化了本体模板,并且可以节省更多的用于存储本体模板的空间,可以有效地降低存储成本。
可选的,下层对象组对应的属性信息的类型包括:实现类和自定义类,该上层对象组对应的属性信息包括:与下层对象组对应的每个实现类的属性信息所描述的属性相同的属性信息,且不包括与下层对象组对应的每个自定义类的属性信息所描述的属性相同的属性信息。示例的,请继续参考图4,人对象组对应的属性信息中的身份证号码和出生日期均为实现类的属性信息,而性别和级别均为自定义类的属性信息。顶层对象组对应的属性信息包括:与身份证号码所描述的属性相同的属性信息(身份标识码),以及与出生日期所描述的属性相同的(诞生时间),而不包括与性别和级别所描述的属性相同的属性信息。
需要说明的是,本发明实施例中仅以多个对象组包括:顶层对象组、人对象组、车对象组、学生对象组和警察对象组为例,实际应用中,多个对象组还可以包括其他对象组,如:老师对象组、建筑对象组、亲属关系对象组、师生关系对象组等,本发明实施例对此不做限定。每个对象的属性信息还可以包括上述实施例中并未提到信息,如人的实例属性信息还可以包括:民族;关系的属性信息还可以包括:关系的种类(如亲属关系、师生关系等多种关系种类),本发明实施例在此不做赘述。
图5为本发明实施例提供的一种获取本体模板的方法流程图。如图5所示,获取上述本体模板的过程可以包括:
步骤2011、确定多个对象组中每个对象组的属性信息。
示例的,该本体构建方法可以用于计算机设备,在步骤2011中,计算机设备可以通过历史数据和/或专家的经验值确定属性信息。
步骤2012、检测多个对象组中的第i个对象组是否满足上拢条件以及下沉条件。
在步骤2012前,还需要将该多个对象组通过层级的形式关联,之后,再检测该多个对象组中的第i个对象组是否满足上拢条件和下沉条件。
其中,上拢条件包括:第i个对象组关联的每个下一层对象组的属性信息所描述的属性均包括第一属性,且第i个对象组的属性信息所描述的属性不包括第一属性,1≤i≤j,j为多个对象组中对象组的个数。例如,假设学生对象组和警察对象组的属性信息所描述的属性均包括级别属性,如学生对象组的属性信息中的年级用于描述级别属性,警察对象组的属性信息中的职称用于描述级别属性。若人对象组的属性信息所描述的属性不包括级别属性,则可以确定人对象组满足上拢条件。
下沉条件包括:所述第i个对象组的属性信息所描述的属性包括第二属性,且所述第i个对象组关联的每个下一层对象组的属性信息所描述的属性均不包括第二属性。例如,假设人对象组的属性信息中的级别用于描述级别属性,若学生对象组和警察对象组的属性信息所描述的属性均不包括级别属性,如学生对象组的属性信息不包括年级,警察对象组的属性信息不包括职称,则可以确定人对象组满足下沉条件。
步骤2013、在第i个对象组满足上拢条件时,在第i个对象组的属性信息中增加用于描述第一属性的属性信息,以更新多个对象组的属性信息。
在确定第i个对象组关联的每个下一层对象组的属性信息所描述的属性均包括第一属性,而该第i个对象组的属性信息所描述的属性却不包括第一属性时,可以在该第i个对象组的属性信息中增加用于描述第一属性的属性信息,以对该第i个对象组的属性信息进行更新。也即,从多个下层对象组的属性信息中提取得到上层对象组需要具有的属性,从而能够根据多个下层对象组的属性对上层对象组的属性信息进行调整,以避免由于经验缺失或者专家的疏忽大意,漏掉上层对象组的部分属性信息。
步骤2014、在第i个对象组满足下沉条件时,将第i个对象组的属性信息中用于描述第二属性的属性信息去除,以更新多个对象组的属性信息。
在确定第i个对象组关联的每个下一层对象组的属性信息所描述的属性均不包括第二属性,而该第i个对象组的属性信息所描述的属性包括第二属性时,可以确定该第i个对象组实质上也并不具有第二属性。此时,可以将第i个对象组的属性信息中用于描述第二属性的属性信息进行去除,以对该第i个对象组的属性信息进行更新。也即,从多个下层对象组的属性信息中推出上层对象组不需要具有的属性信息,从而能够根据多个下层对象组的属性信息对上层对象组的属性信息进行调整,以避免由于经验缺失或者专家的疏忽大意,确定出上层对象组的属性信息多余的情况。
步骤2015、根据更新后的多个对象组的属性信息确定本体模板。
步骤202、根据本体模板和实例化规则,对指定的数据集合进行实例化处理,得到多个对象的实例属性信息。
该指定的数据集合为需要进行实例化处理的数据,对该数据集合进行处理能够得到多个对象的实例属性信息。在步骤202中,计算机设备需要首先根据本体模板确定每个底层对象组的属性信息。
示例的,当本体模板的实现方式为如图3所示的实现方式时,计算机设备可以直接从本体模板中获取每个底层对象组对应的属性信息,并将获取到的每个对象组对应的属性信息,确定为该每个对象组的属性信息。当本体模板的实现方式为如图4所示的实现方式时,计算机设备需要首先从本体模板中获取每个底层对象组对应的属性信息,以及获取该每个底层对象组关联的上一层对象组对应的属性信息;之后,可以将获取到的属性信息(该每个底层对象组对应的属性信息,以及该每个对象组关联的上一层对象组对应的属性信息)均确定为该每个底层对象组的属性信息。
在确定每个底层对象组的属性信息后,还可以获取预设的实例化规则。之后,就可以基于该每个底层对象组的属性信息,结合实例化规则对数据集合进行实例化处理,以在数据集合中提取多个对象的实例属性信息。示例的,假设底层对象组为学生,则实例化处理之后,可以得到小红(小红是一个学生)的实例属性信息可以包括:6XXXX...XXX(身份证号码的实例化)、198X年12月X日(出生日期的实例化)、小红(姓名的实例化)、女(性别的实例化)、三年级(年级的实例化)、第三小学(学校名称的实例化)。需要说明的是,上述“X”表示“某”。
由于该本体模板记载的每个对象组的属性信息包括该对象组在时间维度上的时维属性信息,因此,最终实例化处理得到的每个对象的实例属性信息可以包括:每个对象在时间维度上的时维属性信息。
需要说明的是,本体描述的对象可以为:实体、实体间的关系或实体相关的事件,以下将对这三种对象(实体、关系和事件)的实例属性信息中的时维属性信息进行解释说明。
第一方面,实体的时维属性信息可以包括:用于记载实体是否消亡的存续标识。可选的,实体的时维属性信息还可以包括:实体的诞生时间和/或实体的消亡时间的指示信息。可选的,实体的时维属性信息还可以包括:实体的存续事件标识,存续事件标识用于记载实体的时维属性信息发生变化的触发事件。
示例的,人(一种实体)的时维属性信息可以包括:存续标识1、出生日期(用于记载人的诞生日期的指示信息)、死亡日期(用于记载人的消亡时间的指示信息)、存续事件标识。其中,存续标识1用于记载人活着,存续标识0用于记载人已死亡。车(一种实体)的时维属性信息可以包括:存续标识0、生产日期(用于记载车的诞生日期的指示信息)、报废日期(用于记载车的消亡时间的指示信息)、存续事件标识。其中,存续标识1用于记载车并未报废,存续标识0用于记载车已报废。
第二方面,事件(与实体相关的时间)的时维属性信息可以包括:是否有向、主动方、被动方、事件起始时间和事件结束时间。需要说明的是,事件有向是指:该事件由一方实体发起,且另一方实体被动参与;而事件无向是指:该事件由参与的所有实体发起并参与。
第三方面,关系(实体间的关系)的时维属性信息包括:关系的版本标识,其中,每个关系具有至少一个版本标识,每个版本标识唯一对应关系所维持的一个时间段。可选的,关系的时维属性信息还包括:关系的起始时间和/或关系的结束时间。可选的,关系的时维属性信息还包括:关系的来源事件标识,来源事件标识用于记载与关系的每个版本标识相关的事件。
以同住关系为例,假设多个实体在交叉时间范围内入住同一个房间,即定义为该多个实体具有同住关系。例如,张三在2017年9月1日~2017年9月5日入住A酒店602房间,李四在2017年9月2日~2017年9月5日入住A酒店602房间,张三在2017年10月1日~2017年10月5日入住B酒店402房间,李四在2017年10月2日~2017年10月5日入住B酒店402房间。
显然在2017年9月,张三和李四存在同住关系,张三和李四的同住关系的关系版本可以为关系版本1,该关系版本1对应的时间段为9月2日~2017年9月5日;在2017年10月张三和李四再次存在同住关系,张三和李四的这个同住关系的关系版本可以为关系版本2,该关系版本2对应的时间段为10月2日~2017年10月5日。
需要说明的是,当某一对象实质上不具有某一属性,且本体模板中记载的该对象的属性信息包括用于描述该属性的属性信息时,在对数据集合进行实例化处理时,可以将该对象的该属性信息的实例化(也即实例属性信息)置空,或不对该属性信息进行实例化。如,在对数据集合进行实例化处理时,若实体并未消亡,则可以将实体的时维属性信息中消亡事件的指示信息置空,或者,不对该属性信息进行实例化,从而在对数据集合进行实例化处理后不会得到该消亡事件的指示信息。
步骤203、按照指定的存储结构,存储多个对象的实例属性信息,以构建本体。
需要说明的是,在存储多个对象的实例属性信息时,可以根据对象的类型采用不同的方式对其实例属性信息进行存储。
第一方面,对于多个对象的实例属性信息中,第i个实体的实例属性信息,计算机设备可以检测本地是否存储有第i个实体的历史实例属性信息,1≤i≤k,k为多个对象中实体的个数;在本地存储有与第i个实体的历史实例属性信息时,计算机设备可以采用第i个实体的实例属性信息覆盖其历史实例属性信息。
也即,计算机设备一旦最新得到某一实体的实例属性信息,则可以将最新的该实例属性信息覆盖该实体的历史实例属性信息,以保证计算机设备本地始终存储有最新的实例属性信息,使得计算机设备本地存储的实例属性信息与真实世界中实体的属性信息一致。
第二方面,对于多个对象的实例属性信息中,第i个事件的实例属性信息,计算机设备可以直接进行存储。
第三方面,对于多个对象的实例属性信息中,第h个关系的实例属性信息,计算机设备可以首先确定本地存储的第h个关系的历史实例属性信息的个数,1≤h≤p,p为该多个对象中关系的个数。示例的,计算机设备可以将本地存储的第h个关系的关系版本的个数,确定为本地存储的第h个关系的历史实例属性信息的个数。之后,计算机设备需要判断本地存储的第h个关系的历史实例属性信息的个数是否大于预设个数阈值;并在本地存储的第h个关系的历史实例属性信息的个数大于预设个数阈值时,将本地存储的第h个关系的可清理历史实例属性信息移动至外设回收站,以使得第h个关系的剩余历史实例属性信息的个数小于或等于预设个数阈值;之后就可以存储该第h个关系的实例属性信息。该外设回收站会对其中存储的数据进行定时删除,可选的,该外设回收站可以根据计算机设备的指示定时删除数据。
可选的,剩余历史实例属性信息中的关系版本为剩余关系版本,可清理历史实例属性信息中的关系版本为可清理关系版本;剩余关系版本所指示的时间段在可清理关系版本所指示的时间段之后。例如,假设该第h个关系为上述同住关系,且剩余关系版本为关系版本2,剩余关系版本所指示的时间段为:2017年10月2日~2017年10月5日,可清理关系版本为关系版本1,可清理关系版本所指示的时间段为2017年9月2日~2017年9月5日。这样一来,能够保证计算机设备本地存储的同一关系的实例属性信息的个数总是较少,从而减轻了计算机设备的存储压力;并且,能够保证最新发生的关系能够被保存在计算机设备本地,便于后续对最新发生的关系的查询。
步骤204、在目标参数更新时对本体进行更新。
可选的,该目标参数可以包括本体模板、实例化规则以及数据集合中的至少一个。本发明实施例中以目标参数包括本体模板、实例化规则以及数据集合为例。需要说明的是,该本体模板、实例化规则以及数据集合均可以存储在计算机设备的外设存储介质上,且本体模板、实例化规则以及数据集合均可以存储在不同的外设存储介质,本发明实施例对此不做限定。工作人员可以对外设存储介质上的本体模板进行更新。
在步骤204中,计算机设备可以检测本体模板、实例化规则以及数据集合是否更新;当本体模板、实例化规则以及数据集合中的至少一个更新时,计算机设备可以根据当前的本体模板和当前的实例化规则对待处理数据进行实例化处理,以得到多个更新对象的实例属性信息,其中,待处理数据为当前的数据集合中当前的实例化规则所指示的待进行实例化处理的数据。之后,计算机设备可以将多个更新对象的实例属性信息覆盖已存储的实例属性信息,以更新本体。
也即,本发明实施例中创建的本体能够随目标参数和时间进行改变,从而使得本发明实施例中创建的本体并不是一成不变的,而是动态变化的本体,该本体可以称为时维动态本体。
步骤205、获取目标查询条件,目标查询条件包括:时间条件。
在创建得到本体后,人们就可以在计算机设备上对本体进行查询,以获取相应的实例属性信息。
示例的,当人们在计算机设备上对本体进行查询时,人们可以在计算机设备中输入初始查询条件,使得计算机设备能够接收到初始查询条件。示例的,该初始条件可以包括:时间条件(2017年9月1日~2017年9月5日)、关系类型(同住关系)、主动方(张三)、被动方(李四)。
之后,计算机设备就需要判断初始查询条件是否包括时间条件,并在初始查询条件包括时间条件时,确定初始查询条件为目标查询条件。需要说明的是,若该初始查询条件不包括时间条件,则计算机设备可以将预设的时间条件加入初始查询条件,以得到目标查询条件。其中,该预设的时间条件可以用于记载最近的一个时间段,如某一历史时间到当前时间的时间段。比如,当前时间为2018年10月1日,则该预设的时间条件可以用于记载:2018年9月1日至2018年10月1日这个时间段。
步骤206、根据目标查询条件,查询本体中是否存在满足目标查询条件的目标实例属性信息。在本体中存在目标实例属性信息时,执行步骤207;在本体中不存在目标实例属性信息时,执行步骤208。
步骤207、获取目标实例属性信息。
示例的,假设目标查询条件包括:时间条件(2017年9月1日~2017年9月5日)、关系类型(同住关系)、主动方(张三)、被动方(李四),则可以根据该目标查询条件,在本体中查找到目标实例属性信息为:张三和李四在2017年9月1日~2017年9月5日的同住关系的实例属性信息。
步骤208、查询外设回收站中是否存在目标实例属性信息。在外设回收站中存在目标实例属性信息时,执行步骤207;在外设回收站中不存在目标实例属性信息时,执行步骤209。
当本体中不存在目标实例属性信息时,由于该目标实例属性信息有可能是被移动至外设回收站中,因此,可以在该外设回收站中继续查询是否存在目标实例属性信息。在外设回收站中存在目标实例属性信息时,可以获取该外设回收站中的目标实例属性信息。
步骤209、采用预设处理方式对数据集合中的目标数据进行处理,以得到目标实例属性信息。
其中,采用预设处理方式对数据集合中的目标数据进行处理可以包括:根据当前的本体模板和当前的实例化规则对数据集合中的目标数据进行实例化处理,以得到目标实例属性信息。
当本体和外设回收站中均不存在目标实例属性信息时,计算机设备可以获取数据集合中的目标数据,该目标数据为数据集合中在指定时间段内生成的数据,该指定时间段为时间条件所指示的时间段。之后,计算机设备可以根据当前的本体模板(也即最新的本体模板)和当前的实例化规则(也即最新的实例化规则)对该目标数据进行处理,以得到目标实例属性信息。
综上所述,由于本发明实施例得到的实例属性信息包括时间维度的时维属性信息,因此,基于该实例属性信息构建的本体能够描述对象与时间的关系,这样一来,本体描述的对象能够与真实世界中的对象统一,提高了本体的准确度。
并且,在构建本体时,首先获取本体模板,之后再根据该本体模板得到多个对象的实例属性信息。由于本体模板能够根据属性以层级的形式对多个对象组进行关联,从而能够对真实世界中多且杂乱的对象进行了有序的多层归类分组,使得对本体需要描述的对象能够进行有序的罗列,因此,降低了本体构建过程的复杂度。
另外,相关技术中,虽然存在按照对象的类型对多个对象进行分组的概念,但相关技术中复杂多样的对象有时候并不能很好的进行分组,如某一对象有可能同时被分配到多个对象组中,这就会对本体中对象的属性信息的准确度产生影响。而本发明实施例中,根据属性以层级的形式对多个对象组进行关联,从而能够对真实世界中多且杂乱的对象进行了有序的多层归类分组,使得本体中对象的属性信息的准确度较高。
相关技术中的分组是基于对象的类型,所以这种分组的方法的粒度级别是类型,而本发明实施例中分组的方法的粒度级别为属性。因此,本发明实施例实现了从按类型分组到按属性分组的转变,实现了从粗粒度级别的分组到细粒度级别的分组的转变,细化了对象的分组。
图6为本发明实施例提供的一种本体构建装置的结构示意图,如图6所示,该本体构建装置可以包括:
第一处理模块601,用于对指定的数据集合进行实例化处理,得到多个对象中每个对象的实例属性信息;
存储模块602,用于按照指定的存储结构,存储多个对象的实例属性信息,以构建本体;
其中,每个对象的实例属性信息包括:每个对象在时间维度上的时维属性信息。
综上所述,由于本发明实施例中第一处理模块得到的实例属性信息包括时间维度的时维属性信息,因此,存储模块基于该实例属性信息构建的本体能够描述对象与时间的关系,这样一来,本体描述的对象能够与真实世界中的对象统一,提高了本体的准确度。
可选的,多个对象存在至少一个为实体的对象,实体的时维属性信息包括:
用于指示实体是否消亡的存续标识;
和/或,实体的诞生时间和/或实体的消亡时间的指示信息;
和/或,实体的存续事件标识,存续事件标识用于指示实体的时维属性信息发生变化的触发事件。
可选的,存储模块602用于:
对于多个对象的实例属性信息中,第i个实体的实例属性信息,检测本地是否存储有第i个实体的历史实例属性信息,1≤i≤k,k为多个对象中实体的个数;
在本地存储有与第i个实体的历史实例属性信息时,采用第i个实体的实例属性信息覆盖其历史实例属性信息。
可选的,多个对象中存在至少一个为关系的对象,该关系为实体间的关系,该关系的时维属性信息包括:
关系的版本标识,其中,每个关系具有至少一个版本标识,每个版本标识唯一对应关系所维持的一个时间段;
和/或,关系的起始时间和/或关系的结束时间的指示信息;
和/或,关系的来源事件标识,来源事件标识用于指示与关系的每个版本标识相关的事件。
可选的,存储模块用于:
对于多个对象的实例属性信息中,第h个关系的实例属性信息,确定本地存储的第h个关系的历史实例属性信息的个数,1≤h≤p,p为多个对象中关系的个数;
判断本地存储的第h个关系的历史实例属性信息的个数是否大于预设个数阈值;
在本地存储的第h个关系的历史实例属性信息的个数大于预设个数阈值时,将本地存储的第h个关系的可清理历史实例属性信息移动至外设回收站,以使得第h个关系的剩余历史实例属性信息的个数小于或等于预设个数阈值;
存储第h个关系的实例属性信息。
可选的,剩余历史实例属性信息中的关系版本为剩余关系版本,可清理历史实例属性信息中的关系版本为可清理关系版本;
剩余关系版本所对应的时间段在可清理关系版本所对应的时间段之后。
可选的,图7为本发明实施例提供的另一种本体构建装置的结构示意图,如图7所示,在图6的基础上,该本体构建装置还包括:
第一获取模块603,用于获取本体模板和实例化规则,本体模板用于记载多个对象组的属性信息,每个对象组中包括属于同一类型的对象,多个对象组以层级的形式关联;
第一处理模块601用于:根据本体模板和实例化规则,对数据集合进行实例化处理;其中,多个对象中每个对象的实例属性信息为基于本体模板所记载的属性信息,在数据集合中提取的信息。
检测模块604,用于分别检测本体模板、实例化规则以及数据集合是否更新;
第二处理模块605,用于在本体模板、实例化规则以及数据集合中的至少一个更新时,根据当前的本体模板和当前的实例化规则对待处理数据进行实例化处理,以得到多个更新对象的实例属性信息,其中,待处理数据为当前的数据集合中当前的实例化规则所指示的待进行实例化处理的数据;
覆盖模块606,用于将多个更新对象的实例属性信息覆盖已存储的实例属性信息,以更新本体。
第二获取模块607,用于获取目标查询条件,目标查询条件包括:时间条件;
第一查询模块608,用于根据目标查询条件,查询本体中是否存在满足目标查询条件的目标实例属性信息;
第三获取模块609,用于在本体中存在目标实例属性信息时,获取目标实例属性信息。
第二查询模块610,用于在本体不包括目标实例属性信息时,查询外设回收站中是否存在目标实例属性信息;
第三获取模块609还用于在外设回收站中存在目标实例属性信息时,执行获取目标实例属性信息的步骤;
第三处理模块611,用于在外设回收站中不存在目标实例属性信息时,根据当前的本体模板和当前的实例化规则对所述数据集合中的目标数据进行实例化处理,以得到目标实例属性信息;
其中,时间条件用于指示指定时间段,目标数据为数据集合中在指定时间段内生成的数据。
第二获取模块608用于:接收初始查询条件;判断初始查询条件是否包括时间条件;在初始查询条件包括时间条件时,确定初始查询条件为目标查询条件;在初始查询条件不包括时间条件时,将预设的时间条件加入初始查询条件,以得到目标查询条件。
综上所述,由于本发明实施例中第一处理模块得到的实例属性信息包括时间维度的时维属性信息,因此,存储模块基于该实例属性信息构建的本体能够描述对象与时间的关系,这样一来,本体描述的对象能够与真实世界中的对象统一,提高了本体的准确度。
本发明实施例还提供了一种计算机可读存储介质,存储介质内存储有计算机程序,计算机程序被处理器执行时实现上述本体构建方法。
需要说明的是,本发明实施例提供的本体构建方法实施例与本体构建装置实施例可以互相参考,本发明实施例对此不做限定。
以上所述仅为本申请的可选实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (16)

1.一种本体构建方法,其特征在于,所述方法包括:
对指定的数据集合进行实例化处理,得到多个对象中每个对象的实例属性信息;其中,所述每个对象的实例属性信息包括:所述每个对象在时间维度上的时维属性信息;
按照指定的存储结构,存储所述多个对象的实例属性信息,以实现根据对象的类型采用不同的方式对其实例属性信息进行存储,从而构建所述本体,所述本体是对真实世界中的实体、实体涉及的事件以及实体之间的关系的描述,所述多个对象为所述本体描述的对象,所述多个对象包括实体、实体间的关系以及实体相关事件,所述实体相关的事件的时维属性信息包括主动方、被动方、事件起始时间和事件结束时间;
其中,在所述多个对象中存在至少一个为实体的对象,所述实体的时维属性信息包括:用于记载所述实体是否消亡的存续标识;和/或,所述实体的诞生时间的指示信息;和/或,所述实体的消亡时间的指示信息;和/或,所述实体的存续事件标识,所述存续事件标识用于记载所述实体的时维属性信息发生变化的触发事件的情况下,所述存储所述多个对象的实例属性信息,包括:对于所述多个对象的实例属性信息中,第i个实体的实例属性信息,检测本地是否存储有所述第i个实体的历史实例属性信息,1≤i≤k,k为所述多个对象中实体的个数;在本地存储有与所述第i个实体的历史实例属性信息时,采用所述第i个实体的实例属性信息覆盖其历史实例属性信息;
在所述多个对象中存在至少一个为关系的对象,所述关系为实体间的关系,所述关系的时维属性信息包括:所述关系的版本标识,其中,每个所述关系具有至少一个版本标识,每个所述版本标识唯一对应所述关系所维持的一个时间段;和/或,所述关系的起始时间的指示信息;和/或,所述关系的结束时间的指示信息;和/或,所述关系的来源事件标识,所述来源事件标识用于记载与所述关系的每个版本标识相关的事件的情况下,所述存储所述多个对象的实例属性信息,包括:对于所述多个对象的实例属性信息中,第h个关系的实例属性信息,确定本地存储的所述第h个关系的历史实例属性信息的个数,1≤h≤p,p为所述多个对象中关系的个数;判断本地存储的所述第h个关系的历史实例属性信息的个数是否大于预设个数阈值;在本地存储的所述第h个关系的历史实例属性信息的个数大于所述预设个数阈值时,将本地存储的所述第h个关系的可清理历史实例属性信息移动至外设回收站,以使得所述第h个关系的剩余历史实例属性信息的个数小于或等于所述预设个数阈值;存储第h个关系的实例属性信息。
2.根据权利要求1所述的方法,其特征在于,
所述剩余历史实例属性信息中的关系版本为剩余关系版本,所述可清理历史实例属性信息中的关系版本为可清理关系版本;
所述剩余关系版本所对应的时间段在所述可清理关系版本所对应的时间段之后。
3.根据权利要求1所述的方法,其特征在于,
在所述对指定的数据集合进行实例化处理之前,所述方法还包括:获取本体模板和实例化规则,其中,所述本体模板用于记载多个对象组的属性信息,每个对象组中包括属于同一类型的对象,所述多个对象组以层级的形式关联;
所述对指定的数据集合进行实例化处理,包括:根据所述本体模板和所述实例化规则,对所述数据集合进行所述实例化处理;
其中,所述多个对象中每个对象的实例属性信息为基于所述本体模板所记载的属性信息,在所述数据集合中提取的信息。
4.根据权利要求3所述的方法,其特征在于,在存储所述多个对象的实例属性信息之后,所述方法还包括:
分别检测所述本体模板、所述实例化规则以及所述数据集合是否更新;
当所述本体模板、所述实例化规则以及所述数据集合中的至少一个更新时,根据当前的本体模板和当前的实例化规则对待处理数据进行实例化处理,以得到多个更新对象的实例属性信息,其中,所述待处理数据为当前的数据集合中所述当前的实例化规则所指示的待进行实例化处理的数据;
将所述多个更新对象的实例属性信息覆盖已存储的实例属性信息,以更新所述本体。
5.根据权利要求1所述的方法,其特征在于,在基于所述多个对象的实例属性信息构建所述本体之后,所述方法还包括:
获取目标查询条件,所述目标查询条件包括:时间条件;
根据所述目标查询条件,查询所述本体中是否存在满足所述目标查询条件的目标实例属性信息;
在所述本体中存在所述目标实例属性信息时,获取所述目标实例属性信息。
6.根据权利要求5所述的方法,其特征在于,所述获取目标查询条件,包括:
接收初始查询条件;
判断所述初始查询条件是否包括所述时间条件;
在所述初始查询条件包括所述时间条件时,确定所述初始查询条件为所述目标查询条件;
在所述初始查询条件不包括所述时间条件时,将预设的时间条件加入所述初始查询条件,以得到所述目标查询条件。
7.根据权利要求5所述的方法,其特征在于,所述方法还包括:
在所述本体不包括所述目标实例属性信息时,查询外设回收站中是否存在所述目标实例属性信息;
在所述外设回收站中存在所述目标实例属性信息时,执行获取所述目标实例属性信息的步骤;
在所述外设回收站中不存在所述目标实例属性信息时,根据当前的本体模板和当前的实例化规则对所述数据集合中的目标数据进行实例化处理,以得到所述目标实例属性信息;
其中,所述时间条件用于记载指定时间段,所述目标数据为所述数据集合中在所述指定时间段内生成的数据。
8.一种本体构建装置,其特征在于,所述本体构建装置包括:
第一处理模块,用于对指定的数据集合进行实例化处理,得到多个对象中每个对象的实例属性信息;其中,所述每个对象的实例属性信息包括:所述每个对象在时间维度上的时维属性信息;
存储模块,用于按照指定的存储结构,存储所述多个对象的实例属性信息,以实现根据对象的类型采用不同的方式对其实例属性信息进行存储,从而构建所述本体,所述本体是对真实世界中的实体、实体涉及的事件以及实体之间的关系的描述,所述多个对象为所述本体描述的对象,所述多个对象包括实体、实体间的关系以及实体相关事件,所述实体相关的事件的时维属性信息包括主动方、被动方、事件起始时间和事件结束时间;
所述多个对象中存在至少一个为实体的对象,所述实体的时维属性信息包括:用于记载所述实体是否消亡的存续标识;和/或,所述实体的诞生时间的指示信息;和/或,所述实体的消亡时间的指示信息;和/或,所述实体的存续事件标识,所述存续事件标识用于记载所述实体的时维属性信息发生变化的触发事件;
所述存储模块还用于:
对于所述多个对象的实例属性信息中,第i个实体的实例属性信息,检测本地是否存储有所述第i个实体的历史实例属性信息,1≤i≤k,k为所述多个对象中实体的个数;在本地存储有与所述第i个实体的历史实例属性信息时,采用所述第i个实体的实例属性信息覆盖其历史实例属性信息;
所述多个对象中存在至少一个为关系的对象,所述关系为实体间的关系,所述关系的时维属性信息包括:所述关系的版本标识,其中,每个所述关系具有至少一个版本标识,每个所述版本标识唯一对应所述关系所维持的一个时间段;和/或,所述关系的起始时间的指示信息;和/或,所述关系的结束时间的指示信息;和/或,所述关系的来源事件标识,所述来源事件标识用于记载与所述关系的每个版本标识相关的事件;
对于所述多个对象的实例属性信息中,第h个关系的实例属性信息,确定本地存储的所述第h个关系的历史实例属性信息的个数,1≤h≤p,p为所述多个对象中关系的个数;判断本地存储的所述第h个关系的历史实例属性信息的个数是否大于预设个数阈值;在本地存储的所述第h个关系的历史实例属性信息的个数大于所述预设个数阈值时,将本地存储的所述第h个关系的可清理历史实例属性信息移动至外设回收站,以使得所述第h个关系的剩余历史实例属性信息的个数小于或等于所述预设个数阈值;存储第h个关系的实例属性信息。
9.根据权利要求8所述的本体构建装置,其特征在于,
所述剩余历史实例属性信息中的关系版本为剩余关系版本,所述可清理历史实例属性信息中的关系版本为可清理关系版本;
所述剩余关系版本所对应的时间段在所述可清理关系版本所对应的时间段之后。
10.根据权利要求8所述的本体构建装置,其特征在于,
所述本体构建装置还包括:
第一获取模块,用于获取本体模板和实例化规则,其中,所述本体模板用于记载多个对象组的属性信息,每个对象组中包括属于同一类型的对象,所述多个对象组以层级的形式关联;
所述第一处理模块用于:根据所述本体模板和所述实例化规则,对所述数据集合进行所述实例化处理;
其中,所述多个对象中每个对象的实例属性信息为基于所述本体模板所记载的属性信息,在所述数据集合中提取的信息。
11.根据权利要求10所述的本体构建装置,其特征在于,所述本体构建装置还包括:
检测模块,用于分别检测所述本体模板、所述实例化规则以及所述数据集合是否更新;
第二处理模块,用于在所述本体模板、所述实例化规则以及所述数据集合中的至少一个更新时,根据当前的本体模板和当前的实例化规则对待处理数据进行实例化处理,以得到多个更新对象的实例属性信息,其中,所述待处理数据为当前的数据集合中所述当前的实例化规则所指示的待进行实例化处理的数据;
覆盖模块,用于将所述多个更新对象的实例属性信息覆盖已存储的实例属性信息,以更新所述本体。
12.根据权利要求8所述的本体构建装置,其特征在于,所述本体构建装置还包括:
第二获取模块,用于获取目标查询条件,所述目标查询条件包括:时间条件;
第一查询模块,用于根据所述目标查询条件,查询所述本体中是否存在满足所述目标查询条件的目标实例属性信息;
第三获取模块,用于在所述本体中存在所述目标实例属性信息时,获取所述目标实例属性信息。
13.根据权利要求12所述的本体构建装置,其特征在于,所述第二获取模块用于:
接收初始查询条件;
判断所述初始查询条件是否包括所述时间条件;
在所述初始查询条件包括所述时间条件时,确定所述初始查询条件为所述目标查询条件;
在所述初始查询条件不包括所述时间条件时,将预设的时间条件加入所述初始查询条件,以得到所述目标查询条件。
14.根据权利要求12所述的本体构建装置,其特征在于,所述本体构建装置还包括:
第二查询模块,用于在所述本体不包括所述目标实例属性信息时,查询外设回收站中是否存在所述目标实例属性信息;
所述第三获取模块还用于在所述外设回收站中存在所述目标实例属性信息时,执行获取所述目标实例属性信息的步骤;
第三处理模块,用于在所述外设回收站中不存在所述目标实例属性信息时,根据当前的本体模板和当前的实例化规则对所述数据集合中的目标数据进行实例化处理,以得到所述目标实例属性信息;
其中,所述时间条件用于记载指定时间段,所述目标数据为所述数据集合中在所述指定时间段内生成的数据。
15.一种计算机设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过总线完成相互间的通信;存储器,用于存放计算机程序;处理器,用于执行存储器上所存放的程序,实现权利要求1至7任一所述的方法。
16.一种计算机可读存储介质,其特征在于,所述存储介质内存储有计算机程序,所述计算机程序被处理器执行时实现权利要求1至7任一所述的方法。
CN201810701221.XA 2018-06-29 2018-06-29 本体构建方法及装置 Active CN109033208B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201810701221.XA CN109033208B (zh) 2018-06-29 2018-06-29 本体构建方法及装置
PCT/CN2019/093683 WO2020001616A1 (zh) 2018-06-29 2019-06-28 本体构建方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810701221.XA CN109033208B (zh) 2018-06-29 2018-06-29 本体构建方法及装置

Publications (2)

Publication Number Publication Date
CN109033208A CN109033208A (zh) 2018-12-18
CN109033208B true CN109033208B (zh) 2021-07-02

Family

ID=65521010

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810701221.XA Active CN109033208B (zh) 2018-06-29 2018-06-29 本体构建方法及装置

Country Status (2)

Country Link
CN (1) CN109033208B (zh)
WO (1) WO2020001616A1 (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109033208B (zh) * 2018-06-29 2021-07-02 杭州海康威视数字技术股份有限公司 本体构建方法及装置
CN111598116B (zh) * 2019-02-21 2024-01-23 杭州海康威视数字技术股份有限公司 数据分类方法、装置、电子设备及可读存储介质
CN116204554B (zh) * 2023-05-04 2023-08-08 浙江康勒工业软件有限公司 数据处理方法、系统、电子设备和存储介质

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1866250A (zh) * 2005-10-12 2006-11-22 华为技术有限公司 对系统数据进行管理的方法和系统
US8059635B1 (en) * 2006-05-05 2011-11-15 Workday, Inc. Non-destructive data storage
CN105528204A (zh) * 2015-01-27 2016-04-27 北京理工大学 领域本体的构建方法和装置

Family Cites Families (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107844600A (zh) * 2017-11-23 2018-03-27 浪潮软件集团有限公司 一种数据存储方法和装置
CN108062379B (zh) * 2017-12-13 2021-07-30 北京天广汇通科技有限公司 数据处理方法、平台、装置和计算机可读存储介质
CN108205593A (zh) * 2017-12-29 2018-06-26 华为技术有限公司 一种查询的方法及装置
CN109033208B (zh) * 2018-06-29 2021-07-02 杭州海康威视数字技术股份有限公司 本体构建方法及装置

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1866250A (zh) * 2005-10-12 2006-11-22 华为技术有限公司 对系统数据进行管理的方法和系统
US8059635B1 (en) * 2006-05-05 2011-11-15 Workday, Inc. Non-destructive data storage
CN105528204A (zh) * 2015-01-27 2016-04-27 北京理工大学 领域本体的构建方法和装置

Also Published As

Publication number Publication date
WO2020001616A1 (zh) 2020-01-02
CN109033208A (zh) 2018-12-18

Similar Documents

Publication Publication Date Title
CN110688495B (zh) 一种事件信息的知识图谱模型构建方法、装置、存储介质
CN109189867B (zh) 基于公司知识图谱的关系发现方法、装置及存储介质
CN109033208B (zh) 本体构建方法及装置
CN110727799B (zh) 本体构建方法及装置
DE102013209868B4 (de) Abfragen und Integrieren strukturierter und unstrukturierter Daten
CN116484972A (zh) 在机器人之间共享学习的信息
CN111026874A (zh) 知识图谱的数据处理方法及服务器
CN102254012B (zh) 一种基于外存的图数据存储方法及子图查询方法
Amirinejad et al. Ambiguity at the peri-urban interface in Australia
CN104252507B (zh) 一种企业数据匹配方法和装置
CN101930454B (zh) 上下文敏感的空间信息服务推送方法
CN106164896A (zh) 用于发现复杂两对手方或多对手方关系的多维递归学习过程及系统
Salem Peri-urban dynamics and land-use planning for the Greater Cairo Region in Egypt
WO2023124191A1 (zh) 基于深度图匹配的医疗数据元自动化分类方法及系统
CN108734414A (zh) 一种海洋环境监测数据标准化入库及评价分析系统
Santipantakis et al. OBDAIR: Ontology-Based Distributed framework for Accessing, Integrating and Reasoning with data in disparate data sources
CN111737364A (zh) 安全多方数据融合与联邦共享方法、装置、设备及介质
CN112463986A (zh) 信息存储的方法及装置
CN110674413B (zh) 用户关系挖掘方法、装置、设备和存储介质
CN114036318A (zh) 面向泛感知数据的基于时序图的公共安全知识图谱生成方法
CN111368060B (zh) 对话机器人的自学习方法、装置、系统、电子设备及介质
CN117216109A (zh) 一种多类型混合数据的数据查询方法、装置及存储介质
CN115934969A (zh) 一种不可移动文物风险评估知识图谱构建方法
CN114780864A (zh) 一种基于知识图谱的人-物-空间交互模型构建方法
CN110175197B (zh) 一种基于语义物联网的本体构建方法和系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant