发明内容
针对现有技术存在的缺陷,本发明提供一种原子级数据元素模型的建模方法,具有建模过程清晰简单的优点。
本发明采用的技术方案如下:
本发明提供一种原子级数据元素模型的建模方法,包括以下步骤:
S1,按6W原则将作业过程中涉及到的各种概念划分归类,得到概念目录;其中,所述概念目录由按顺序排列的时间类数据元素表项、地点类数据元素表项、对象类数据元素表项、参与者类数据元素表项、业务活动类数据元素表项、资料类数据元素表项、特征类数据元素表项和参照类数据元素表项共八类数据元素表项组成;每一个表项均包括标识字段、数据元素名称字段、数据元素类别字段和数据元素类型字段;所述时间类数据元素表项用于记录与时间类数据元素相关的信息;所述地点类数据元素表项用于记录与地点类数据元素相关的信息;所述对象类数据元素表项用于记录与对象类数据元素相关的信息;所述参与者类数据元素表项用于记录与参与者类数据元素相关的信息;所述业务活动类数据元素表项用于记录与业务活动类数据元素相关的信息;所述资料类数据元素表项用于记录与资料类数据元素相关的信息;所述特征类数据元素表项用于记录与特征类数据元素相关的信息;所述参照类数据元素表项用于记录与参照类数据元素相关的信息;
S2,根据关系建立规则建立八类数据元素之间的关系;
S3,进一步明确各类数据元素的重复次数和值域,得到最终的数据元素模型。
优选的,S1中,所述标识字段通过以下方法定义:按照同类数据元素之间的包含关系,被包含的元素作为子节点,呈树形结构分级别分层次定义标识字段。
优选的,所述标识字段的结构为:第1数字+第1分隔符+第2数字+第2分隔符......第n数字的循环格式,其中,n≥2;第1数字代表八类数据元素按S1中列出的顺序;标识为第1数字+第1分隔符+第2数字+第2分隔符...+第j数字的数据元素是标识为第1数字+第1分隔符+第2数字+第2分隔符...+第(j-1)数字的数据元素的子节点。
优选的,S1中,所述时间类数据元素代表作业过程中所有与时间相关的概念集合,具体包括时间、次序、步长、速节;
所述地点类数据元素代表作业过程中所有与空间相关的概念集合,具体包括绝对地点、相对地点、参照地点、拓扑地点;
所述对象类数据元素代表作业过程中所有与不具有生命特征相关的概念集合,其中,所述不具有生命特征相关的概念包括:设施、设备、零部件、材料和工具;
所述参与者类数据元素代表作业过程中所有具有生命特征的概念集合,具体包括:组织机构、部门、岗位、角色;
所述业务活动类数据元素代表作业过程中所有与生产作业活动相关的概念集合,具体包括领域类、过程类和活动类;
所述资料类数据元素代表作业过程中所有记载了活动结果的资料类概念集合,具体包括报告、附件、流媒体和矢量数据;
所述特征类数据元素代表作业过程中所有对象特征的概念集合,具体包括值域、符号、描述、逻辑;
所述参照类数据元素用于对以上七类数据元素进行限定作用的概念集合,具体包括范围、状态、性质和场景。
优选的,S2中,建立八类数据元素之间的关系具体为:建立八类数据元素之间的关系、条件、约束和规则;其中,关系指包含关系,其在建立概念目录时建立,以标识字段的形式表现;条件指事情发生前应该具备的、影响活动是否发生的条件;约束指事情发生过程中应该满足的、导致事情是否正常的约束;规则指关系,条件和约束组织在一起的方式;其中,条件、约束还加以标识符来标识重要度;标识符区分为M、C和O;M代表的重要度为必须;C代表的重要度为重要;O代表的重要度为不重要。
优选的,S2中,所述关系建立规则包括以下规则:
规则一:根据关系、条件、约束和规则的定义控制数据元素之间是否可以建立关系,以及建立关系的具体类型;
规则二:按照业务活动类数据元素中的领域类、过程类和活动类,以及所述特征类数据元素,将八类数据元素划分为四个层次,通过四个层次的逐级约束标准化一个数据元素;
规则三:按照关系最紧密原则和场景最明确原则建立八类数据元素之间的关系。
优选的,规则二中,四个层次包括:
1)系列,用于对领域级活动场景描述;
2)集合,用于对活动过程级场景描述;
3)实体,用于对具体业务活动的描述;
4)子集,用于对活动对象特征的描述。
优选的,规则二中,每个层次均完整的体现6W原则。
优选的,规则三中,所述场景最明确原则为:规则二中的四个层次,其中系列,以领域类的数据元素为核心,与其他元素建立关系;集合,以过程类的数据元素为核心,与其他元素建立关系;实体,以活动类的数据元素为核心,与其他元素建立关系;子集,以特征类的数据元素为核心,与其他元素建立关系。
所述关系最紧密原则为:将关系最紧密的第一类数据元素和第二类数据元素建立最直接的关系,在与第二类数据元素建立关系的时候,仅使用第一类数据元素即可。
优选的,S1中,所述每一个表项还包括:条件字段、约束字段、值域字段、重复次数字段、重要度字段和备注字段。
优选的,所述每一个表项还包括:计量单位字段。
优选的,S3之后,还包括:
S4,定义所述数据元素模型的存储结构,按该存储结构存储各个数据元素模型;其中,各个数据元素模型的存储方式为:按照数据元素与数据元素之间的关系,以及数据元素与场景之间的关系,通过语义网状结构的拓扑图方式存储。
优选的,S3之后,还包括:
S4,定义所述数据元素模型的存储结构,按该存储结构存储各个数据元素模型;其中,各个数据元素模型的存储方式为:按照数据元素与数据元素之间的关系,以及数据元素与场景之间的关系,通过语义网状结构的拓扑图方式存储。
本发明提供的原子级数据元素模型的建模方法,具有以下优点:
(1)建模过程清晰简单,设计内容丰富,书写流畅;
(2)用标识来表达业务逻辑层次,层次关系清晰易读;
(3)用值域、约束、条件来控制概念之间的关系,简单易行,直截了当;
(4)包含企业内所有的概念,且通过逐层描述对数据背景描述的完整完备;
(5)采用结构严谨的关系建模方法,建模过程易于生产者的分析和理解;
(6)概念层次、相互关系清晰,容易衍生出业务流程图、对象关系图、数据管理结构、系统功能结构等;
(7)通过数据元的唯一标识,可以实现系统功能、服务和数据三个层次的集成;
(8)使计算可以进行自学习;
(9)扩展性好,允许从不同角度对每个层次进行描述,且能融合成完整统一的整体。
具体实施方式
以下结合附图对本发明进行详细说明:
如图1所示,本发明提供的原子级数据元素模型的建模方法,包括以下步骤:
S1、按6W原则将作业过程中涉及到的各种概念划分归类,得到概念目录,
该概念目录由按顺序排列的时间类数据元素表项、地点类数据元素表项、对象类数据元素表项、参与者类数据元素表项、业务活动类数据元素表项、资料类数据元素表项、特征类数据元素表项和参照类数据元素表项共八类数据元素表项组成;每一个表项均包括标识字段、数据元素名称字段、数据元素类别字段和数据元素类型字段,根据实际需求,还可以包括:条件字段、约束字段、值域字段、重复次数字段、重要度字段、计量单位字段和备注字段。所述时间类数据元素表项用于记录与时间类数据元素相关的信息;所述地点类数据元素表项用于记录与地点类数据元素相关的信息;所述对象类数据元素表项用于记录与对象类数据元素相关的信息;所述参与者类数据元素表项用于记录与参与者类数据元素相关的信息;所述业务活动类数据元素表项用于记录与业务活动类数据元素相关的信息;所述资料类数据元素表项用于记录与资料类数据元素相关的信息;所述特征类数据元素表项用于记录与特征类数据元素相关的信息;所述参照类数据元素表项用于记录与参照类数据元素相关的信息。
其中,6W原则是指:诺贝尔文学奖获得者英国作家吉卜林的思考问题、解决问题的“6W原则”,在此基础上明确了业务逻辑6W描述方法,即“Where(什么地方)、When(什么时间)、Who(什么人)、Which(针对啥)、What(做了什么,含如何做)、Why(为什么)”。
如表1所示,为一种具体的概念目录示例。
表1
其中,标识字段通过以下方法定义:按照同类数据元素之间的包含关系,被包含的元素作为子节点,呈树形结构分级别分层次定义标识字段。
标识字段的结构为:第1数字+第1分隔符+第2数字+第2分隔符......第n数字的循环格式,其中,n≥2;第1数字代表八类数据元素按S1中列出的顺序;标识为第1数字+第1分隔符+第2数字+第2分隔符...+第j数字的数据元素是标识为第1数字+第1分隔符+第2数字+第2分隔符...+第(j-1)数字的数据元素的子节点。例如:标识是2.1.1的数据元素为标识是2.1的数据元素的子节点,标识是2.1的数据元素包含标识是2.1.1的数据元素。
本发明中,八类数据元素存在先后顺序,各类数据元素的具体含义为:
(1)时间类数据元素代表作业过程中所有与时间相关的概念集合,具体包括时间、次序、步长、速节;
(2)地点类数据元素代表作业过程中所有与空间相关的概念集合,具体包括绝对地点、相对地点、参照地点、拓扑地点;
(3)对象类数据元素代表作业过程中所有与不具有生命特征相关的概念集合,其中,所述不具有生命特征相关的概念包括:设施、设备、零部件、材料和工具;
(4)参与者类数据元素代表作业过程中所有具有生命特征的概念集合,具体包括:组织机构、部门、岗位、角色;
(5)业务活动类数据元素代表作业过程中所有与生产作业活动相关的概念集合,具体包括领域类、过程类和活动类;
(6)资料类数据元素代表作业过程中所有记载了活动结果的资料类概念集合,具体包括报告、附件、流媒体和矢量数据;
(7)特征类数据元素代表作业过程中所有对象特征的概念集合,具体包括值域、符号、描述、逻辑;
(8)参照类数据元素用于对以上七类数据元素进行限定作用的概念集合,具体包括范围、状态、性质和场景。
S2、根据关系建立规则建立八类数据元素之间的关系;
具体的,需要建立八类数据元素之间的关系、条件、约束和规则;其中,关系指包含关系,其在建立概念目录时建立,以标识字段的形式表现;条件指事情发生前应该具备的、影响活动是否发生的条件;约束指事情发生过程中应该满足的、导致事情是否正常的约束;规则指关系,条件和约束组织在一起的方式;其中,条件、约束还加以标识符来标识重要度;标识符区分为M、C和O;M代表的重要度为必须;C代表的重要度为重要;O代表的重要度为不重要。
关系建立规则包括以下规则:
规则一:根据关系、条件、约束和规则的定义控制数据元素之间是否可以建立关系,以及建立关系的具体类型;
数据元素之间建立关系的规则包括:
(1)允许时间类、地点类、对象类、参与者类、资料类作为活动类的条件,其中对象类是必须存在的;
(2)允许参与者类、对象类、活动类、作为资料类的条件,其中活动类是必须存在的;
(3)允许时间类、地点类、参与者类、对象类、活动类、资料类作为特征类的条件,其中活动类是必须存在的;
(4)允许参照类作为时间类的约束;
(5)允许参照类作为地点类的约束;
(6)允许对象类、参与者类、资料类作为活动类的约束;
(7)允许参与者类、对象类作为资料类的约束;
(8)允许特征类作为对象类的约束;
(9)允许参照类作为特征类的约束;
(10)不在以上允许范围内的分类之间不能建立条件。
规则二:按照业务活动类数据元素中的领域类、过程类和活动类,以及所述特征类数据元素,将八类数据元素划分为四个层次,通过四个层次的逐级约束标准化一个数据元素;
本规则中,每个层次均完整的体现6W原则。
四个层次包括:
1)系列,用于对领域级活动场景描述;
2)集合,用于对活动过程级场景描述;
3)实体,用于对具体业务活动的描述;
4)子集,用于对活动对象特征的描述。
规则三:按照关系最紧密原则和场景最明确原则建立八类数据元素之间的关系。
场景最明确原则为:规则二中的四个层次,其中系列,以领域类的数据元素为核心,与其他元素建立关系;集合,以过程类的数据元素为核心,与其他元素建立关系;实体,以活动类的数据元素为核心,与其他元素建立关系;子集,以特征类的数据元素为核心,与其他元素建立关系。
例如,如表2,首先建立系列级场景,并保证场景足够明确:“钻井”是领域类数据元素,应以“钻井”为核心元素。“钻井”活动离不开“井”(要钻哪口井),因此“井”作为“钻井”活动的M条件
然后建立集合级场景,其中“生产作业”是过程级活动元素,那么应该以生产作业为核心。“生产作业”作为“钻井”的子活动(由标识字段可得出),肯定也离不开“井”,但是“生产作业”活动是发生在“井”的其中一个子结构“井筒”上,因此,按照最紧密原则,只需建立“井筒”与“生产作业”的关系即可。
表2
关系最紧密原则还有一种体现:例如,一般情况下,我们提到某个概念的时候,都会把另外一个概念带入进来,这种情况下,按照关系最紧密原则,将后面的概念与前面的概念建立最直接的关系,在与第三类概念建立关系的时候仅使用前面的概念即可,从而减轻建模的工作量。例如:一般提到某个人的时候姓名这个特征都会跟随,那么直接将“姓名”作为“人”的约束,这样当“人”作为活动的条件的时候,这个活动中必然存在人的姓名这个特征。如表3,将特征类元素“井号”作为对象类元素“井”的约束,那么所有涉及到“井”的场景都要体现“井号”这个特征。
表3
S3,进一步明确各类数据元素的重复次数和值域,得到最终的数据元素模型。
其中,重复次数:,也称为频度,指在前提条件明确的情况下可发生的次数,如,在上一级场景每发生一次,下面的场景要发生1次还是N次。
值域:存在于特性类元素上,表示一个数据元在某中计量单位下的取值范围。如表4所示,为重复次数和值域示例。
表4
S3之后,还包括:
S4,定义所述数据元素模型的存储结构,按该存储结构存储各个数据元素模型;如图2所示,为数据元素模型结构图;其中,各个数据元素模型的存储方式如图3所示,为按照数据元素与数据元素之间的关系,以及数据元素与场景之间的关系,通过语义网状结构的拓扑图方式存储。
本发明提出的原子级数据元素模型,建立了概念层面和语义层面上的数据元,基于数据元素模型进而可以得到数据元素之间的语义网状结构,用于对数据的准确定义,进而繁衍出用于数据语义描述的逻辑和应用层面的数据元,并为利用计算机自动识别获取自由文本中的数据元提供了一种手段。
本发明提供的原子级数据元素模型建模方法,具有以下优点:
(1)打破了传统的数据定义方式,采用结构化更强的概念建模方式,重点关注数据产生环境,抛弃其物理存储结构,逐级对数据产生环境的内在细节进行描述,便于与其它类型的类别模型建立映射关系,实现相互转换和驱动服务;另外,重视数据产生环境中每个层次涉及到概念以及概念之间的关系,实现多业务多角度数据的融合;而且,通过对数据产生环境的描述,将相关知识经验、处理方法、驱动规则、语义概念在一个模型中集中表达出来,从而简化未来智慧系统知识体系建设的关系复杂性和结构多变性,为智能业务驱动提供基本逻辑关系;
(2)采用关系树“标识”方法建立每个维度的概念之间的层级关系,用“条件”和“约束”建立概念间的依赖关系,用“值域”约束数据的填写范围,便于计算机理解和执行;
(3)采用逐层描述的叙事建模方法,每个层面均通过6W进行描述,指导业务人员从宏观到微观,从逻辑关系到具体细节,改善传统数据元建模方式。
本发明提供的原子级数据元素模型建模方法,简单来说,具有以下优点:
(1)建模过程清晰简单,设计内容丰富,书写流畅;
(2)用标识来表达业务逻辑层次,层次关系清晰易读;
(3)用值域、约束、条件来控制概念之间的关系,简单易行,直截了当;
(4)包含企业内所有的概念,且通过逐层描述对数据背景描述的完整完备;
(5)采用结构严谨的关系建模方法,建模过程易于生产者的分析和理解;
(6)概念层次、相互关系清晰,容易衍生出业务流程图、对象关系图、数据管理结构、系统功能结构等;
(7)通过数据元的唯一标识,可以实现系统功能、服务和数据三个层次的集成;
(8)使计算可以进行自学习;
(9)扩展性好,允许从不同角度对每个层次进行描述,且能融合成完整统一的整体。
以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视本发明的保护范围。