CN112529082A - 一种系统画像构建方法、装置和设备 - Google Patents
一种系统画像构建方法、装置和设备 Download PDFInfo
- Publication number
- CN112529082A CN112529082A CN202011473044.8A CN202011473044A CN112529082A CN 112529082 A CN112529082 A CN 112529082A CN 202011473044 A CN202011473044 A CN 202011473044A CN 112529082 A CN112529082 A CN 112529082A
- Authority
- CN
- China
- Prior art keywords
- label
- target system
- categories
- process data
- tag
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000010276 construction Methods 0.000 title claims abstract description 28
- 238000000034 method Methods 0.000 claims abstract description 92
- 230000008569 process Effects 0.000 claims abstract description 68
- 238000012360 testing method Methods 0.000 claims description 14
- 238000013461 design Methods 0.000 claims description 11
- 238000003860 storage Methods 0.000 claims description 11
- 238000004422 calculation algorithm Methods 0.000 claims description 10
- 238000007418 data mining Methods 0.000 claims description 10
- 238000011161 development Methods 0.000 claims description 10
- 238000012827 research and development Methods 0.000 claims description 6
- 238000007619 statistical method Methods 0.000 claims description 6
- 238000012552 review Methods 0.000 claims description 5
- 238000013507 mapping Methods 0.000 claims description 3
- 238000000638 solvent extraction Methods 0.000 claims description 2
- 238000004519 manufacturing process Methods 0.000 description 12
- 238000012545 processing Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 8
- 238000010586 diagram Methods 0.000 description 6
- 230000000694 effects Effects 0.000 description 6
- 238000012986 modification Methods 0.000 description 5
- 230000004048 modification Effects 0.000 description 5
- 238000004458 analytical method Methods 0.000 description 4
- 238000004364 calculation method Methods 0.000 description 4
- 238000004590 computer program Methods 0.000 description 4
- 238000004891 communication Methods 0.000 description 3
- 230000008439 repair process Effects 0.000 description 3
- 238000012098 association analyses Methods 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000010230 functional analysis Methods 0.000 description 2
- 238000010801 machine learning Methods 0.000 description 2
- 230000001364 causal effect Effects 0.000 description 1
- 239000007795 chemical reaction product Substances 0.000 description 1
- 238000004140 cleaning Methods 0.000 description 1
- 230000001149 cognitive effect Effects 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 238000012217 deletion Methods 0.000 description 1
- 230000037430 deletion Effects 0.000 description 1
- 238000000605 extraction Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 238000002372 labelling Methods 0.000 description 1
- 238000012423 maintenance Methods 0.000 description 1
- 238000013486 operation strategy Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/243—Classification techniques relating to the number of classes
- G06F18/2431—Multiple classes
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本说明书实施例提供了一种系统画像构建方法、装置和设备,其中,该方法包括:从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,标签值与标签规则一一对应;基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,得到分类结果;根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值;利用所述各个标签的结果值和所述标签体系,构建目标系统的系统画像。在本说明书实施例中,构建的系统画像可以从多个维度直观的认知目标系统,进而可以有效的针对目标系统进行提升或改进。
Description
技术领域
本说明书实施例涉及数据处理技术领域,特别涉及一种系统画像构建方法、装置和设备。
背景技术
IT(Information Technology,信息技术)系统研发实施工作中产生的过程数据包含了大量的有效信息,这些数据能够客观反应系统情况,具有很高的潜在价值。然而,目前这些数据并未得到充分、有效地分析及利用。现有技术中,只是对单一指标数据的进行简单采集与展示,系统研发实施工作中产生的大量过程数据未被整合分析和充分挖掘其价值。因此,采用现有技术中的技术方案无法从系统研发实施工作中产生的大量过程数据中直观的认知系统,从而有针对性地对系统进行提升和改进。
针对上述问题,目前尚未提出有效的解决方案。
发明内容
本说明书实施例提供了一种系统画像构建方法、装置和设备,以解决现有技术中无法从系统研发实施工作中产生的大量过程数据中直观的认知系统,以有针对性地对系统进行提升和改进的问题。
本说明书实施例提供了一种系统画像构建方法,包括:从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,所述至少两个标签值与所述至少两个标签规则一一对应;基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,得到分类结果;根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值;利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。
本说明书实施例还提供了一种系统画像构建装置,包括:设置模块,用于从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,所述至少两个标签值与所述至少两个标签规则一一对应;分类模块,用于基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,得到分类结果;确定模块,用于根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值;构建模块,用于利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。
本说明书实施例还提供了一种系统画像构建设备,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现所述系统画像构建方法的步骤。
本说明书实施例还提供了一种计算机可读存储介质,其上存储有计算机指令,所述指令被执行时实现所述系统画像构建方法的步骤。
本说明书实施例提供了一种系统画像构建方法,可以从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,所述至少两个标签值与所述至少两个标签规则一一对应。基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,可以将目标系统的过程数据映射至各个标签下。进一步的,可以根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值,并利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。从而可以从多个维度更加直观的认知目标系统,目标系统的系统画像可以从对个维度客观、真实地反映目标系统,进而可以有效的针对目标系统进行提升或改进。
附图说明
此处所说明的附图用来提供对本说明书实施例的进一步理解,构成本说明书实施例的一部分,并不构成对本说明书实施例的限定。在附图中:
图1是根据本说明书实施例提供的系统画像构建方法的步骤示意图;
图2是根据本说明书实施例提供的系统画像构建装置的结构示意图;
图3是根据本说明书实施例提供的系统画像构建设备的结构示意图。
具体实施方式
下面将参考若干示例性实施方式来描述本说明书实施例的原理和精神。应当理解,给出这些实施方式仅仅是为了使本领域技术人员能够更好地理解进而实现本说明书实施例,而并非以任何方式限制本说明书实施例的范围。相反,提供这些实施方式是为了使本说明书实施例公开更加透彻和完整,并且能够将本公开的范围完整地传达给本领域的技术人员。
本领域的技术人员知道,本说明书实施例的实施方式可以实现为一种系统、装置设备、方法或计算机程序产品。因此,本说明书实施例公开可以具体实现为以下形式,即:完全的硬件、完全的软件(包括固件、驻留软件、微代码等),或者硬件和软件结合的形式。
虽然下文描述流程包括以特定顺序出现的多个操作,但是应该清楚了解,这些过程可以包括更多或更少的操作,这些操作可以顺序执行或并行执行(例如使用并行处理器或多线程环境)。
请参阅图1,本实施方式可以提供一种系统画像构建方法。该系统画像构建方法可以用于构建目标系统的系统画像,以从多个维度更加直观的认知目标系统。上述系统画像构建方法可以包括以下步骤。
S101:从多个维度设置目标系统的标签体系;标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,至少两个标签值与至少两个标签规则一一对应。
在本实施方式中,可以从多个维度设置目标系统的标签体系。由于不同的系统面向对象、具备的功能等均会存在差异,因此不同的系统设置标签体系的维度可以是不同的,具体的可以根据实际情况设置,本说明书实施例对此不作限定。
在本实施方式中,上述标签体系中可以包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,至少两个标签值与至少两个标签规则一一对应。其中,上述标签类别可以表征不同标签的属性,标签类别可以包括但不限于:能效、质量、安全等。
在本实施方式中,上述标签规则是是用于计算标签值的规则,上述标签值可以用于对系统在该标签维度的表现进行评估,标签值可以根据标签下的过程数据和标签规则计算得出。例如:标签“生产修复效率”的标签值为高、中、低,其对应的标签规则:生产事件平均解决时长t≤1h(小时)为高,生产事件平均解决时长1h≤t≤10h为中,生产事件平均解决时长t≥10h为低。当然,标签值和标签规则不限于上述举例,所属领域技术人员在本说明书实施例技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本说明书实施例相同或相似,均应涵盖于本说明书实施例保护范围内。
在本实施方式中,可以根据目标系统从设计到交付的过程有针对性的制定目标系统的多个维度。在一些实施例中,上述多个维度可以包括:需求、设计、开发、测试、自动化成熟度、交付,当然可以理解的是还可以包含其它维度,例如:设计资产、评审等,具体的可以根据实际情况确定,本说明书实施例对此不作限定。
S102:基于标签体系中的各个标签对目标系统的过程数据集中的数据进行分类,得到分类结果。
在本实施方式中,为了将目标系统从需求、设计、开发、测试(功能、非功能)、到投产端到端的全生命周期过程中产生的过程数据映射至上述标签体系中,可以基于标签体系中的各个标签对目标系统的过程数据集中的数据进行分类,得到分类结果。其中,上述分类结果中可以包含目标系统的过程数据集中的每个数据分别属于哪个标签。
在本实施方式中,上述目标系统的过程数据集中可以包含所述目标系统在全生命周期过程中产生的各类数据,这些数据能够客观反应系统情况。上述目标系统在全生命周期过程中产生的各类数据可以存储在目标系统的数据仓库中,由于数据量较大,因此,可以利用数据挖掘算法和统计分析算法从所述目标系统的数据仓库中提取过程数据,从而得到上述过程数据集。
在本实施方式中,上述数据挖掘算法是根据数据创建数据挖掘模型的一组试探法和计算,数据挖掘的主要任务是分类、聚类、关联分析、预测、时序模式和偏差分析。上述统计分析方法包括逻辑思维方法和数量关系分析方法,是源于统计学和泛函分析的一个机器学习理论框架。
S103:根据分类结果和每个标签对应的标签值和标签规则,确定标签体系中各个标签的结果值。
在本实施方式中,由于分类结果中包含目标系统的过程数据集中的每个数据分别属于哪个标签,并且标签规则是是用于计算标签值的规则,因此,可以根据分类结果和每个标签对应的标签值和标签规则,确定标签体系中各个标签的结果值。例如:标签“生产修复效率”的标签值为高、中、低,其对应的标签规则:生产事件平均解决时长t≤1h(小时)为高,生产事件平均解决时长1h≤t≤10h为中,生产事件平均解决时长t≥10h为低,如果计算得到的值为2小时,则标签“生产修复效率”的结果值为“中”。当然,确定标签体系中各个标签的结果值不限于上述举例,所属领域技术人员在本说明书实施例技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本说明书实施例相同或相似,均应涵盖于本说明书实施例保护范围内。
S104:利用各个标签的结果值和标签体系,构建目标系统的系统画像。
在本实施方式中,由于标签体系中规定标签类别、标签、标签规则和标签值之间的关联关系,因此,在计算得到标签体系中各个标签的结果值之后可以利用各个标签的结果值和标签体系,构建得到目标系统的系统画像。
在本实施方式中,可以为目标系统从需求、设计、开发、测试、自动化成熟度、交付等多个维度构建得到系统画像,从而可以更加直观的认知目标系统,对目标系统的运行特征、业务特征、性能特征等方面有一个充分的了解,进而可以有效的对目标系统进行系统运维或运营策略的调整。
在本实施方式中,可以将目标系统的系统画像以雷达图的形式展示,其中,雷达图是以从同一点开始的轴上表示的三个或更多个定量变量的二维图表的形式显示多变量数据的图形方法。当然可以理解的是,系统画像还可以以树状图、表格等形式展示,具体的可以根据实际情况确定,本说明书实施例对此不作限定。
在本实施方式中,为了便于及时获取、展示目标系统的系统画像,可以将目标系统的系统画像存储至目标系统的预设数据库中。
从以上的描述中,可以看出,本说明书实施例实现了如下技术效果:可以从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,所述至少两个标签值与所述至少两个标签规则一一对应。基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,可以将目标系统的过程数据映射至各个标签下。进一步的,可以根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值,并利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。从而可以从多个维度更加直观的认知目标系统,目标系统的系统画像可以从对个维度客观、真实地反映目标系统,进而可以有效的针对目标系统进行提升或改进。
在一个实施方式中,从多个维度设置目标系统的标签体系,可以包括:获取所述目标系统的过程数据集;其中,所述过程数据集中包含所述目标系统在全生命周期过程中产生的数据。可以从所述过程数据集中抽取各个维度的关键数据,将各个维度的关键数据抽象为多个标签类别。进一步的,可以对所述多个标签类别进行层级划分,得到标签类别的层级关系,设置各个标签类别对应的标签和每个标签对应的标签值和标签规则,从而可以基于各个标签类别对应的标签、每个标签对应的标签值和标签规则和标签类别的层级关系构建所述标签体系。
在本实施方式中,上述目标系统的过程数据集中可以包含所述目标系统在全生命周期过程中产生的各类数据,这些数据能够客观反应系统情况。上述目标系统在全生命周期过程中产生的各类数据可以存储在目标系统的数据仓库中,由于数据量较大,因此,可以利用数据挖掘算法和统计分析算法从所述目标系统的数据仓库中提取过程数据,从而得到上述过程数据集。
在本实施方式中,上述数据挖掘算法是根据数据创建数据挖掘模型的一组试探法和计算,数据挖掘的主要任务是分类、聚类、关联分析、预测、时序模式和偏差分析。上述统计分析方法包括逻辑思维方法和数量关系分析方法,是源于统计学和泛函分析的一个机器学习理论框架。
在本实施方式中,各个维度的关键数据可以为最能体现该维度特征的数据。上述多个标签类别可以包括:能效、质量、安全、研发效率、在线化程度、自动化程度、开发质量、设计质量、测试质量、自动化成熟度、交付质量、评审质量、安全性等。由于多个标签类别之间可能会存在包含与被包含的关系,因此,可以对所述多个标签类别进行层级划分,得到标签类别的层级关系。可以划分为至少两个层级,每个标签类别下可以包括至少一个标签。
在一个实施方式中,对所述多个标签类别进行层级划分,可以包括:将所述多个标签类别划分为双层级标签类别;其中,一层级标签类别可以包括:能效、质量、安全,二层级标签类别可以包括:研发效率、在线化程度、自动化程度、开发质量、设计质量、测试质量、自动化成熟度、交付质量、评审质量、安全性。当然,对所述多个标签类别进行层级划分的方式不限于上述举例,所属领域技术人员在本说明书实施例技术精髓的启示下,还可能做出其它变更,但只要其实现的功能和效果与本说明书实施例相同或相似,均应涵盖于本说明书实施例保护范围内。
在一个实施方式中,在基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类之前,还可以包括:利用数据挖掘算法和统计分析算法,从所述目标系统的数据仓库中提取过程数据,得到所述过程数据集。
在本实施方式中,目标系统的研发,从需求、设计、开发、测试(功能、非功能)、到投产端到端全生命周期中存在大量的过程数据,上述过程数据中可以包括:代码、安全性、测试覆盖性、测试完成度等特征数据。可以将采集的上述过程数据通过清洗、特殊字段处理等预处理之后汇总至目标系统的数据仓库中。
在本实施方式中,数据清洗是对数据进行重新审查和校验的过程,包括删除重复信息、检查数据一致性,处理无效值和缺失值等。特殊字段处理是指对不合规的数据进行特殊处理,例如:分母为0的特殊情况,测试案例通过率公式是:成功执行案例数/案例数,如果案例数为0的话,进行特殊处理。特殊处理可以包括:删除、设置替换值等,具体的可以根据实际情况确定,本说明书实施例对此不作限定。
在本实施方式中,由于有些指标或标签数据无法直接使用原始的过程数据,需要对其进行计算出后才能使用,因此,可以根据标签系统中的标签,进行针对性的过程数据采集,并将计算得到的数据存储至数据仓库中。例如:标签部署自动化平均时长,计算方法为部署总时长/部署次数×100%。可以理解的是,上述计算处理的步骤可以在汇总至数据仓库之前执行,也可以在计算标签的结果值之前执行,具体的可以根据实际情况确定,本说明书实施例对此不作限定。
在一个实施方式中,根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值,可以包括:根据所述分类结果确定每个标签下的过程数据,进一步的,可以根据每个标签对应的标签值和标签规则,通过结构化查询语言将各个标签下的过程数据计算为各个标签的结果值。
在本实施方式中,由于计算涉及的数据量较大,为了提高效率,可以利用结构化查询语言批量化地将各个标签下的过程数据计算为各个标签的结果值。其中,上述结构化查询语言(SQL,Structured Query Language)是一种特殊目的的编程语言,是一种数据库查询和程序设计语言,用于存取数据以及查询、更新和管理关系数据库系统,同时也是数据库脚本文件的扩展名。
在一个实施方式中,利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像,可以包括:获取各个标签的权重,可以根据所述各个标签的权重、标签体系中标签类别与标签的映射关系,对所述各个标签的结果值进行加权求和,得到各个标签类别的结果值。进一步的,可以利用所述各个标签类别的结果值和所述标签体系,构建所述目标系统的系统画像。
在本实施方式中,各个标签的权重可以是预先设置,权重可以为大于等于0小于等于1的数值。在本实施方式中,获取各个标签的权重的方式可以包括:从预设数据库中查询得到,或者,接收输入的各个标签的权重。当然可以理解的是,还可以采用其它可能的方式获取上述各个标签的权重,例如,按照预设路径查询各个标签的权重,具体的可以根据实际情况确定,本说明书实施例对此不作限定。
在本实施方式中,由于每个标签类别下包含至少一个标签,因此,可以对各个标签类别下的标签结果值进行加权求和,从而可以得到各个标签类别的结果值。例如:标签类别自动化程度,对应的标签是测试自动化和部署自动化,测试自动化权值为50%、标签结果值为80;部署自动化权值为50%、标签结果值为100。自动化程度的标签规则为:高:90-100、中:90-75、低:75以下,所以对测试自动化和部署自动化的结果值加权求和后得到:80×0.5+100×0.5=90,则自动化程度的结果值为高。
在一个实施方式中,在利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像之后,还可以包括:将所述目标系统的系统画像存储至目标数据库中。进一步的,可以按照预设时间间隔获取所述目标系统在预设时间段内产生的过程数据,并利用在预设时间段内产生的过程数据更新所述标签体系中各个标签对应的标签规则。
在本实施方式中,在构建得到系统画像之后,系统仍会不断地产生大量的过程数据,为了提高标签的精准度,可以利用历史数据地对标签规则进行优化。可以在构建得到初始的系统画像之后,按照预设时间间隔获取目标系统在预设时间段内产生的过程数据,并利用获取的数据对标签体系中各个标签对应的标签规则进行更新。
在本实施方式中,上述预设时间间隔可以为:1个月、6个月、1年等,上述预设时间段可以为距当前时间点一个月内、或者距当前时间点一年内,具体的可以根据实际情况确定,本说明书实施例对此不作限定。例如:可以取距当前时间点一年内的投产版本的平均值或top10的数据作为标签规则更新的参考值。
基于同一发明构思,本说明书实施例中还提供了一种系统画像构建装置,如下面的实施例所述。由于系统画像构建装置解决问题的原理与系统画像构建方法相似,因此系统画像构建装置的实施可以参见系统画像构建方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。图2是本说明书实施例的系统画像构建装置的一种结构框图,如图2所示,可以包括:设置模块201、分类模块202、确定模块203和构建模块204,下面对该结构进行说明。
设置模块201,可以用于从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,所述至少两个标签值与所述至少两个标签规则一一对应;
分类模块202,可以用于基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,得到分类结果;
确定模块203,可以用于根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值;
构建模块204,可以用于利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。
在一个实施方式中,设置模块201可以包括:第一获取单元,用于获取所述目标系统的过程数据集;其中,所述过程数据集中包含所述目标系统在全生命周期过程中产生的数据;抽取单元,用于从所述过程数据集中抽取各个维度的关键数据;抽象单元,用于将各个维度的关键数据抽象为多个标签类别;层级划分单元,用于对所述多个标签类别进行层级划分,得到标签类别的层级关系;设置单元,用于设置各个标签类别对应的标签和每个标签对应的标签值和标签规则;第一构建单元,用于基于各个标签类别对应的标签、每个标签对应的标签值和标签规则和标签类别的层级关系构建所述标签体系。
在一个实施方式中,确定模块203可以包括:确定单元,用于根据所述分类结果确定每个标签下的过程数据;计算单元,用于根据每个标签对应的标签值和标签规则,通过结构化查询语言将各个标签下的过程数据计算为各个标签的结果值。
在一个实施方式中,构建模块204可以包括:第二获取单元,用于获取各个标签的权重;加权求和单元,用于根据所述各个标签的权重、标签体系中标签类别与标签的映射关系,对所述各个标签的结果值进行加权求和,得到各个标签类别的结果值;第二构建单元,用于利用所述各个标签类别的结果值和所述标签体系,构建所述目标系统的系统画像。
在一个实施方式中,系统画像构建装置还可以包括:存储模块,用于将所述目标系统的系统画像存储至目标数据库中;更新模块,用于按照预设时间间隔获取所述目标系统在预设时间段内产生的过程数据,并利用在预设时间段内产生的过程数据更新所述标签体系中各个标签对应的标签规则。
本说明书实施例实施方式还提供了一种电子设备,具体可以参阅图3所示的基于本说明书实施例提供的系统画像构建方法的电子设备组成结构示意图,所述电子设备具体可以包括输入设备31、处理器32、存储器33。其中,所述输入设备31具体可以用于输入目标系统的标签体系。所述处理器32具体可以用于基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,得到分类结果;根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值;利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。所述存储器33具体可以用于存储目标系统的系统画像等参数。
在本实施方式中,所述输入设备具体可以是用户和计算机系统之间进行信息交换的主要装置之一。所述输入设备可以包括键盘、鼠标、摄像头、扫描仪、光笔、手写输入板、语音输入装置等;输入设备用于把原始数据和处理这些数的程序输入到计算机中。所述输入设备还可以获取接收其他模块、单元、设备传输过来的数据。所述处理器可以按任何适当的方式实现。例如,处理器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式等等。所述存储器具体可以是现代信息技术中用于保存信息的记忆设备。所述存储器可以包括多个层次,在数字系统中,只要能保存二进制数据的都可以是存储器;在集成电路中,一个没有实物形式的具有存储功能的电路也叫存储器,如RAM、FIFO等;在系统中,具有实物形式的存储设备也叫存储器,如内存条、TF卡等。
在本实施方式中,该电子设备具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
本说明书实施例实施方式中还提供了一种基于系统画像构建方法的计算机存储介质,所述计算机存储介质存储有计算机程序指令,在所述计算机程序指令被执行时可以实现:从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,所述至少两个标签值与所述至少两个标签规则一一对应;基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,得到分类结果;根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值;利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。
在本实施方式中,上述存储介质包括但不限于随机存取存储器(Random AccessMemory,RAM)、只读存储器(Read-Only Memory,ROM)、缓存(Cache)、硬盘(Hard DiskDrive,HDD)或者存储卡(Memory Card)。所述存储器可以用于存储计算机程序指令。网络通信单元可以是依照通信协议规定的标准设置的,用于进行网络连接通信的接口。
在本实施方式中,该计算机存储介质存储的程序指令具体实现的功能和效果,可以与其它实施方式对照解释,在此不再赘述。
显然,本领域的技术人员应该明白,上述的本说明书实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本说明书实施例不限制于任何特定的硬件和软件结合。
虽然本说明书实施例提供了如上述实施例或流程图所述的方法操作步骤,但基于常规或者无需创造性的劳动在所述方法中可以包括更多或者更少的操作步骤。在逻辑性上不存在必要因果关系的步骤中,这些步骤的执行顺序不限于本说明书实施例提供的执行顺序。所述的方法的在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境)。
应该理解,以上描述是为了进行图示说明而不是为了进行限制。通过阅读上述描述,在所提供的示例之外的许多实施方式和许多应用对本领域技术人员来说都将是显而易见的。因此,本说明书实施例的范围不应该参照上述描述来确定,而是应该参照前述权利要求以及这些权利要求所拥有的等价物的全部范围来确定。
以上所述仅为本说明书实施例的优选实施例而已,并不用于限制本说明书实施例,对于本领域的技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的保护范围之内。
Claims (11)
1.一种系统画像构建方法,其特征在于,包括:
从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,所述至少两个标签值与所述至少两个标签规则一一对应;
基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,得到分类结果;
根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值;
利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。
2.根据权利要求1所述的方法,其特征在于,所述多个维度包括:需求、设计、开发、测试、自动化成熟度、交付。
3.根据权利要求1所述的方法,其特征在于,从多个维度设置目标系统的标签体系,包括:
获取所述目标系统的过程数据集;其中,所述过程数据集中包含所述目标系统在全生命周期过程中产生的数据;
从所述过程数据集中抽取各个维度的关键数据;
将各个维度的关键数据抽象为多个标签类别;
对所述多个标签类别进行层级划分,得到标签类别的层级关系;
设置各个标签类别对应的标签和每个标签对应的标签值和标签规则;
基于各个标签类别对应的标签、每个标签对应的标签值和标签规则和标签类别的层级关系构建所述标签体系。
4.根据权利要求3所述的方法,其特征在于,对所述多个标签类别进行层级划分,包括:将所述多个标签类别划分为双层级标签类别;其中,一层级标签类别包括:能效、质量、安全,二层级标签类别包括:研发效率、在线化程度、自动化程度、开发质量、设计质量、测试质量、自动化成熟度、交付质量、评审质量、安全性。
5.根据权利要求1所述的方法,其特征在于,在基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类之前,还包括:
利用数据挖掘算法和统计分析算法,从所述目标系统的数据仓库中提取过程数据,得到所述过程数据集。
6.根据权利要求1所述的方法,其特征在于,根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值,包括:
根据所述分类结果确定每个标签下的过程数据;
根据每个标签对应的标签值和标签规则,通过结构化查询语言将各个标签下的过程数据计算为各个标签的结果值。
7.根据权利要求1所述的方法,其特征在于,利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像,包括:
获取各个标签的权重;
根据所述各个标签的权重、标签体系中标签类别与标签的映射关系,对所述各个标签的结果值进行加权求和,得到各个标签类别的结果值;
利用所述各个标签类别的结果值和所述标签体系,构建所述目标系统的系统画像。
8.根据权利要求1所述的方法,其特征在于,在利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像之后,还包括:
将所述目标系统的系统画像存储至目标数据库中;
按照预设时间间隔获取所述目标系统在预设时间段内产生的过程数据,并利用在预设时间段内产生的过程数据更新所述标签体系中各个标签对应的标签规则。
9.一种系统画像构建装置,其特征在于,包括:
设置模块,用于从多个维度设置目标系统的标签体系;所述标签体系中包括:至少两个标签类别,每个标签类别包含至少一个标签,每个标签对应至少两个标签值和至少两个标签规则,所述至少两个标签值与所述至少两个标签规则一一对应;
分类模块,用于基于所述标签体系中的各个标签对所述目标系统的过程数据集中的数据进行分类,得到分类结果;
确定模块,用于根据所述分类结果和每个标签对应的标签值和标签规则,确定所述标签体系中各个标签的结果值;
构建模块,用于利用所述各个标签的结果值和所述标签体系,构建所述目标系统的系统画像。
10.一种系统画像构建设备,其特征在于,包括处理器以及用于存储处理器可执行指令的存储器,所述处理器执行所述指令时实现权利要求1至8中任一项所述方法的步骤。
11.一种计算机可读存储介质,其特征在于,其上存储有计算机指令,所述指令被执行时实现权利要求1至8中任一项所述方法的步骤。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011473044.8A CN112529082A (zh) | 2020-12-15 | 2020-12-15 | 一种系统画像构建方法、装置和设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011473044.8A CN112529082A (zh) | 2020-12-15 | 2020-12-15 | 一种系统画像构建方法、装置和设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112529082A true CN112529082A (zh) | 2021-03-19 |
Family
ID=74999841
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011473044.8A Pending CN112529082A (zh) | 2020-12-15 | 2020-12-15 | 一种系统画像构建方法、装置和设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112529082A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114090590A (zh) * | 2022-01-20 | 2022-02-25 | 北京华品博睿网络技术有限公司 | 一种多对象标签数据的抽取方法及系统 |
CN115600600A (zh) * | 2022-10-26 | 2023-01-13 | 中电金信软件有限公司(Cn) | 多对象标签体系的标签命名方法、装置、电子设备及介质 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197132A (zh) * | 2017-10-09 | 2018-06-22 | 国网陕西省电力公司 | 一种基于图数据库的电力资产画像构建方法及装置 |
CN109754177A (zh) * | 2018-12-29 | 2019-05-14 | 广州明动软件股份有限公司 | 污染源画像标签体系、污染源画像的构造方法及其应用 |
CN109903097A (zh) * | 2019-03-05 | 2019-06-18 | 云南电网有限责任公司信息中心 | 一种用户画像构建方法以及用户画像构建装置 |
CN111831894A (zh) * | 2019-04-23 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种信息匹配方法及装置 |
-
2020
- 2020-12-15 CN CN202011473044.8A patent/CN112529082A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN108197132A (zh) * | 2017-10-09 | 2018-06-22 | 国网陕西省电力公司 | 一种基于图数据库的电力资产画像构建方法及装置 |
CN109754177A (zh) * | 2018-12-29 | 2019-05-14 | 广州明动软件股份有限公司 | 污染源画像标签体系、污染源画像的构造方法及其应用 |
CN109903097A (zh) * | 2019-03-05 | 2019-06-18 | 云南电网有限责任公司信息中心 | 一种用户画像构建方法以及用户画像构建装置 |
CN111831894A (zh) * | 2019-04-23 | 2020-10-27 | 北京嘀嘀无限科技发展有限公司 | 一种信息匹配方法及装置 |
Non-Patent Citations (1)
Title |
---|
朱锦龙: ""基于大数据的大学生综合行为画像探索"" * |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN114090590A (zh) * | 2022-01-20 | 2022-02-25 | 北京华品博睿网络技术有限公司 | 一种多对象标签数据的抽取方法及系统 |
CN115600600A (zh) * | 2022-10-26 | 2023-01-13 | 中电金信软件有限公司(Cn) | 多对象标签体系的标签命名方法、装置、电子设备及介质 |
CN115600600B (zh) * | 2022-10-26 | 2023-10-17 | 中电金信软件有限公司 | 多对象标签体系的标签命名方法、装置、电子设备及介质 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
US20190347282A1 (en) | Technology incident management platform | |
WO2019218475A1 (zh) | 异常行为对象的识别方法、装置、终端设备及介质 | |
CN106708738B (zh) | 一种软件测试缺陷预测方法及系统 | |
CN103605651A (zh) | 一种基于olap多维分析的数据处理展现方法 | |
CN113157800A (zh) | 实时发现空中动态目标识别方法 | |
CN110457193A (zh) | 基于电力信息系统运维数据的健康画像展示方法及其系统 | |
Li et al. | Data-driven techniques in computing system management | |
CN112529082A (zh) | 一种系统画像构建方法、装置和设备 | |
CN113032403B (zh) | 数据洞察方法、装置、电子设备及存储介质 | |
CN114021156A (zh) | 漏洞自动化聚合的整理方法、装置、设备以及存储介质 | |
CN115577701A (zh) | 针对大数据安全的风险行为识别方法、装置、设备及介质 | |
Aghimien et al. | A review of the application of data mining for sustainable construction in Nigeria | |
CN115619245A (zh) | 一种基于数据降维方法的画像构建和分类方法及系统 | |
CN115203435A (zh) | 基于知识图谱的实体关系生成方法及数据查询方法 | |
CN115705501A (zh) | 机器学习数据处理管道的超参数空间优化 | |
CN111159429B (zh) | 基于知识图谱的数据分析方法及装置、设备、存储介质 | |
CN113538154A (zh) | 风险对象的识别方法、装置、存储介质和电子设备 | |
US20240037084A1 (en) | Method and apparatus for storing data | |
CN117155771B (zh) | 一种基于工业物联网的设备集群故障溯源方法及装置 | |
CN114387103A (zh) | 一种交易风险识别方法和装置 | |
CN111950623B (zh) | 数据稳定性监控方法、装置、计算机设备及介质 | |
CN117436729A (zh) | 一种基于政务系统数据治理和数据分析方法 | |
CN111460293B (zh) | 信息推送方法、装置及计算机可读存储介质 | |
CN110688846A (zh) | 周期词挖掘方法、系统、电子设备及可读存储介质 | |
CN112651782A (zh) | 基于缩放点积注意力的行为预测方法、装置、设备及介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210319 |