CN112651447B - 一种基于本体的资源分类标注方法及系统 - Google Patents
一种基于本体的资源分类标注方法及系统 Download PDFInfo
- Publication number
- CN112651447B CN112651447B CN202011598805.2A CN202011598805A CN112651447B CN 112651447 B CN112651447 B CN 112651447B CN 202011598805 A CN202011598805 A CN 202011598805A CN 112651447 B CN112651447 B CN 112651447B
- Authority
- CN
- China
- Prior art keywords
- classification
- data
- factors
- resource classification
- resource
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/10—Office automation; Time management
- G06Q10/103—Workflow collaboration or project management
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q50/00—Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
- G06Q50/06—Electricity, gas or water supply
Abstract
本申请公开了一种基于本体的资源分类标注方法及系统,通过分类标注计算模型获得与初始资料数据对应的资源分类数据,然后解析资源分类数据中的关联因子,从而获得与资源分类数据对应的资源分类标注数据,实现了电力信息的分类和标注工作智能处理,提高了电力分类和标注的准确性,无需人工判断,降低了人工劳动强度,提高了工作效率。同时,通过判断资源分类标注数据的差异值是否超过预设差异值阈值从而提高分类和标注的实时性和准确性,具有自动校正数据的功能。
Description
技术领域
本申请涉及电力计算技术领域,尤其涉及一种基于本体的资源分类标注方法及系统。
背景技术
一般来说,电力信息的分类与归纳是非常复杂的工作,随着人工智能领域的发展,电力信息开始通过人工智能领域的大数据技术进行处理。然而,目前的电力信息的处理步骤仍然无法实现全自动处理,特别是在获取到初始电力数据后,仍然需要通过人工判断数据来源和内容才能进行分类和标注处理,这不仅增加了人工劳动强度,而且,常常会由于人为疏忽造成数据处理不准确。
发明内容
本申请提供了一种基于本体的资源分类标注方法及系统,用于解决电力信息的分类和标注工作无法实现智能处理而导致的增加人工劳动强度和数据处理不准确的技术问题。
有鉴于此,本申请第一方面提供了一种基于本体的资源分类标注方法,包括以下步骤:
S1:根据预设的本体的参数类别从大数据平台中获取初始资料数据;
S2:通过预先训练好的分类标注计算模型对所述初始资料数据进行分类,从而获得与所述初始资料数据对应的资源分类数据;
S3:通过所述预先训练好的分类标注计算模型解析所述资源分类数据中与所述预设的本体的参数类别相关联的关联因子,从而获得与所述资源分类数据对应的资源分类标注数据;
S4:根据同类的所述资源分类标注数据与所述初始资料数据确定所述资源分类标注数据的差异值,判断所述差异值是否超过预设差异值阈值,若上述判断为是,则执行步骤S2~S4,若上述判断为否,则完成对所述初始资料数据进行分类和标注。
优选地,在所述步骤S1之前包括:对所述初始资料数据进行缺失值插补处理。
优选地,所述预设的本体的参数类别包括建筑材料因子、建筑时间因子、建筑地理因子、电力设备安装因子、电力设备检修因子、技术改造因子和电力调试因子。
优选地,所述初始资料数据包括工程时间因子、成本因子、人力分配因子、故障发生因子、故障维修因子、地理因子、设备使用因子和厂商因子。
优选地,所述步骤S1之后,步骤S2之前包括:
确定预先获取的资料数据样本与对应的参数类别之间的映射关系;
依据所述映射关系设置所述预先获取的资料数据样本与对应的参数类别之间的关联权重值比例;
基于深度学习算法模型建立待训练的权重分类模型,将所述预先获取的资料数据样本与对应的参数类别以及对应的关联权重值比例输入所述待训练的权重分类模型中进行训练,从而获得所述分类标注计算模型。
优选地,所述资源分类标注数据包括建筑分类标注类别、安装分类标注类别、检修分类标注类别、技改分类标注类别和调试分类标注类别。
优选地,所述步骤S4中判断所述差异值是否超过预设差异值阈值,若上述判断为是的步骤还包括:通过所述分类标注计算模型生成警报信息。
第二方面,本发明还提供了一种基于本体的资源分类标注系统,应用上述的基于本体的资源分类标注方法,包括:
获取模块,用于根据预设的本体的参数类别从大数据平台中获取初始资料数据;
分类模块,用于通过预先训练好的分类标注计算模型对所述初始资料数据进行分类,从而获得与所述初始资料数据对应的资源分类数据;
分类标注模块,用于通过所述预先训练好的分类标注计算模型解析所述资源分类数据中与所述预设的本体的参数类别相关联的关联因子,从而获得与所述资源分类数据对应的资源分类标注数据;
判断模块,用于根据同类的所述资源分类标注数据与所述初始资料数据确定所述资源分类标注数据的差异值,还用于判断所述差异值是否超过预设差异值阈值。
优选地,该系统还包括:
处理模块,用于对所述初始资料数据进行缺失值插补处理。
优选地,该系统还包括:
确定模块,用于确定预先获取的资料数据样本与对应的参数类别之间的映射关系;
权重设置模块,用于依据所述映射关系设置所述预先获取的资料数据样本与对应的参数类别之间的关联权重值比例;
建模模块,用于基于深度学习算法模型建立待训练的权重分类模型,还用于将所述预先获取的资料数据样本与对应的参数类别以及对应的关联权重值比例输入所述待训练的权重分类模型中进行训练,从而获得所述分类标注计算模型。
从以上技术方案可以看出,本申请实施例具有以下优点:
本发明实施例提供的一种基于本体的资源分类标注方法及系统,通过分类标注计算模型获得与初始资料数据对应的资源分类数据,然后解析资源分类数据中的关联因子,从而获得与资源分类数据对应的资源分类标注数据,实现了电力信息的分类和标注工作智能处理,提高了电力分类和标注的准确性,无需人工判断,降低了人工劳动强度,提高了工作效率。同时,通过判断资源分类标注数据的差异值是否超过预设差异值阈值从而提高分类和标注的实时性和准确性,具有自动校正数据的功能。
附图说明
图1为本申请实施例提供的一种基于本体的资源分类标注方法的流程图;
图2为本申请另一实施例提供的一种基于本体的资源分类标注方法的流程图;
图3为本申请实施例提供的一种基于本体的资源分类标注系统的结构示意图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
为了便于理解,请参阅图1,本申请提供的一种基于本体的资源分类标注方法,包括以下步骤:
S101:根据预设的本体的参数类别从大数据平台中获取初始资料数据;
需要说明的是,本实施例中的本体指电力工程中的本体工程,而电力工程可以分为建筑、安装、检修、技改、拆除、调试等工程,本体工程为对电力工程本体进行组织、维护和管理的过程,例如电力设计、电力构建、电力开发方法、电力知识的共享与重用、电力知识管理、电力运作过程建模、电力领域知识的系统化标准化、电力常识管理以及电力评价过程等内容。
根据上述本体的描述,本实施例中的参数类别包括建筑材料因子、建筑时间因子、建筑地理因子、电力设备安装因子、电力设备检修因子、技术改造因子和电力调试因子。
本实施例中的初始资料数据包括工程时间因子、成本因子、人力分配因子、故障发生因子、故障维修因子、地理因子、设备使用因子和厂商因子。
可以理解的是,本体的参数类别与初始资源数据构成映射关系,可以从大数据平台中获取与本体的参数类别关联的初始资料数据。例如:将建筑材料因子、厂商因子与技术改造因子视为关联于成本因子,将建筑时间因子视为关联于工程时间因子,将建筑地理因子视为关联于地理因子,将电力设备安装因子视为关联于设备使用因子,将电力设备检修因子视为关联于故障发生因子及故障维修因子,将可以将电力调试因子视为关联于人力分配因子。
S102:通过预先训练好的分类标注计算模型对初始资料数据进行分类,从而获得与初始资料数据对应的资源分类数据;
S103:通过预先训练好的分类标注计算模型解析资源分类数据中与预设的本体的参数类别相关联的关联因子,从而获得与资源分类数据对应的资源分类标注数据;
需要说明的是,通过分类标注计算模型预存的一维关联方程式、二维关联方程式或三维关联方程式计算解析资源分类数据中的关联因子从而产生资源分类标注数据。
其中,资源分类标注数据包括建筑分类标注类别、安装分类标注类别、检修分类标注类别、技改分类标注类别和调试分类标注类别。
在一个具体实施例中,一维关联方程式、二维关联方程式或三维关联方程式可以为数据质量与信息质量的方程式的变化式,根据各个资源分类数据中包含的关联因子通过关联方程式产生资源分类标注数据。
S104:根据同类的资源分类标注数据与初始资料数据确定资源分类标注数据的差异值,判断差异值是否超过预设差异值阈值,若上述判断为是,则执行步骤S102~S104,若上述判断为否,则完成对初始资料数据进行分类和标注。
可以理解的是,根据步骤S102中已经对初始资料数据进行了分类从而获得了资源分类数据,又根据步骤S103获得了资源分类标注数据,由此可以确定同类的资源分类标注数据与初始资料数据;同时,通过资源分类标注数据与初始资料数据可以获得各自相应得语义向量,根据两者的语义向量来确定资源分类标注数据的差异值,而预设差异值阈值可以根据需求或实验所得。通过判断差异值是否超过预设差异值阈值,从而根据判断结果来确定是否继续计算资源分类数据,使得具有自动侦测错误的功能,增加数据检测的准确性。
本实施例通过分类标注计算模型获得与初始资料数据对应的资源分类数据,然后解析资源分类数据中的关联因子,从而获得与资源分类数据对应的资源分类标注数据,实现了电力信息的分类和标注工作智能处理,提高了电力分类和标注的准确性,无需人工判断,降低了人工劳动强度,提高了工作效率。同时,通过判断资源分类标注数据的差异值是否超过预设差异值阈值从而提高分类和标注的实时性和准确性,具有自动校正数据的功能。
以上为本发明提供的一种基于本体的资源分类标注方法的一个实施例的详细描述,以下为本发明提供的一种基于本体的资源分类标注方法的另一个实施例的详细描述。
为了方便理解,请参阅图2,本申请提供的一种基于本体的资源分类标注方法,包括以下步骤:
S201:对初始资料数据进行缺失值插补处理;
可以理解的是,由于初始资料数据在采集或存储过程中可能会出现数据缺失等问题,通过缺失值插补处理可以补全初始资料数据,从而提高后续数据处理的准确性。
S202:根据预设的本体的参数类别从大数据平台中获取初始资料数据;
需要说明的是,本实施例中的本体指电力工程中的本体工程,而电力工程可以分为建筑、安装、检修、技改、拆除、调试等工程,本体工程为对电力工程本体进行组织、维护和管理的过程,例如电力设计、电力构建、电力开发方法、电力知识的共享与重用、电力知识管理、电力运作过程建模、电力领域知识的系统化标准化、电力常识管理以及电力评价过程等内容。
根据上述本体的描述,本实施例中的参数类别包括建筑材料因子、建筑时间因子、建筑地理因子、电力设备安装因子、电力设备检修因子、技术改造因子和电力调试因子。
本实施例中的初始资料数据包括工程时间因子、成本因子、人力分配因子、故障发生因子、故障维修因子、地理因子、设备使用因子和厂商因子。
可以理解的是,本体的参数类别与初始资源数据构成映射关系,可以从大数据平台中获取与本体的参数类别关联的初始资料数据。例如:将建筑材料因子、厂商因子与技术改造因子视为关联于成本因子,将建筑时间因子视为关联于工程时间因子,将建筑地理因子视为关联于地理因子,将电力设备安装因子视为关联于设备使用因子,将电力设备检修因子视为关联于故障发生因子及故障维修因子,将可以将电力调试因子视为关联于人力分配因子。
S203:确定预先获取的资料数据样本与对应的参数类别之间的映射关系;
可以理解的是,在建立分类标注计算模型之前,需要确定训练样本,而通过预先获取基于本体的资料数据样本与对应的参数类别确定映射关系,从而可以获得具有映射关系的训练样本集;
S204:依据映射关系设置预先获取的资料数据样本与对应的参数类别之间的关联权重值比例;
需要说明的是,由于资料数据样本与多种不同的参数类别都可相关联并建立映射关系,因此,需要根据映射关系设置资料数据样本与对应的参数类别之间的关联权重值比例。
在一个具体实施例中,设定关联权重值比例范围为0~1,将建筑材料因子、厂商因子与技术改造因子关联于成本因子的关联权重值比例设为0.2,将建筑时间因子关联于工程时间因子的关联权重值比例设为0.3,将建筑地理因子关联于地理因子的关联权重值比例设为0.4,将电力设备安装因子关联于设备使用因子的关联权重值比例设为0.25,将电力设备检修因子关联于故障发生因子及故障维修因子的权重值比例设为0.35,将电力调试因子关联于人力分配因子的关联权重值比例设为0.3。
S205:基于深度学习算法模型建立待训练的权重分类模型,将预先获取的资料数据样本与对应的参数类别以及对应的关联权重值比例输入待训练的权重分类模型中进行训练,从而获得分类标注计算模型;
在本实施例中,将预先获取的资料数据样本与对应的参数类别以及对应的关联权重值比例作为训练样本集输入待训练的权重分类模型中进行训练从而建立具有依据权重分类功能的分类标注计算模型。
S206:通过分类标注计算模型对初始资料数据进行分类,从而获得与初始资料数据对应的资源分类数据;
S207:通过预先训练好的分类标注计算模型解析资源分类数据中与预设的本体的参数类别相关联的关联因子,从而获得与资源分类数据对应的资源分类标注数据;
需要说明的是,通过分类标注计算模型预存的一维关联方程式、二维关联方程式或三维关联方程式计算解析资源分类数据中的关联因子从而产生资源分类标注数据。
其中,资源分类标注数据包括建筑分类标注类别、安装分类标注类别、检修分类标注类别、技改分类标注类别和调试分类标注类别。
在一个具体实施例中,一维关联方程式、二维关联方程式或三维关联方程式可以为数据质量与信息质量的方程式的变化式,根据各个资源分类数据中包含的关联因子通过关联方程式产生资源分类标注数据。
S208:根据同类的资源分类标注数据与初始资料数据确定资源分类标注数据的差异值,判断差异值是否超过预设差异值阈值,若上述判断为是,则执行步骤S206~S208,若上述判断为否,则完成对初始资料数据进行分类和标注。
在本实施例中,步骤S208中判断差异值是否超过预设差异值阈值,若上述判断为是的步骤还包括:通过分类标注计算模型生成警报信息,以提高数据处理的安全性和及时性。
可以理解的是,根据步骤S206中已经对初始资料数据进行了分类从而获得了资源分类数据,又根据步骤S207获得了资源分类标注数据,由此可以确定同类的资源分类标注数据与初始资料数据;同时,通过资源分类标注数据与初始资料数据可以获得各自相应得语义向量,根据两者的语义向量来确定资源分类标注数据的差异值,而预设差异值阈值可以根据需求或实验所得。通过判断差异值是否超过预设差异值阈值,从而根据判断结果来确定是否继续计算资源分类数据,使得具有自动侦测错误的功能,增加数据检测的准确性。
以上为本发明提供的一种基于本体的资源分类标注方法的另一个实施例的详细描述,以下为本发明提供的一种基于本体的资源分类标注系统的一个实施例的详细描述。
为了方便理解,请参阅图3,本申请还提供了一种基于本体的资源分类标注系统,应用上述实施例中的基于本体的资源分类标注方法,包括:
获取模块100,用于根据预设的本体的参数类别从大数据平台中获取初始资料数据;
需要说明的是,本实施例中的本体指电力工程中的本体工程,而电力工程可以分为建筑、安装、检修、技改、拆除、调试等工程,本体工程为对电力工程本体进行组织、维护和管理的过程,例如电力设计、电力构建、电力开发方法、电力知识的共享与重用、电力知识管理、电力运作过程建模、电力领域知识的系统化标准化、电力常识管理以及电力评价过程等内容。
根据上述本体的描述,本实施例中的参数类别包括建筑材料因子、建筑时间因子、建筑地理因子、电力设备安装因子、电力设备检修因子、技术改造因子和电力调试因子。
本实施例中的初始资料数据包括工程时间因子、成本因子、人力分配因子、故障发生因子、故障维修因子、地理因子、设备使用因子和厂商因子。
可以理解的是,本体的参数类别与初始资源数据构成映射关系,可以从大数据平台中获取与本体的参数类别关联的初始资料数据。例如:将建筑材料因子、厂商因子与技术改造因子视为关联于成本因子,将建筑时间因子视为关联于工程时间因子,将建筑地理因子视为关联于地理因子,将电力设备安装因子视为关联于设备使用因子,将电力设备检修因子视为关联于故障发生因子及故障维修因子,将可以将电力调试因子视为关联于人力分配因子。
分类模块200,用于通过预先训练好的分类标注计算模型对初始资料数据进行分类,从而获得与初始资料数据对应的资源分类数据;
分类标注模块300,用于通过预先训练好的分类标注计算模型解析资源分类数据中与预设的本体的参数类别相关联的关联因子,从而获得与资源分类数据对应的资源分类标注数据;
需要说明的是,通过分类标注计算模型预存的一维关联方程式、二维关联方程式或三维关联方程式计算解析资源分类数据中的关联因子从而产生资源分类标注数据。
其中,资源分类标注数据包括建筑分类标注类别、安装分类标注类别、检修分类标注类别、技改分类标注类别和调试分类标注类别。
在一个具体实施例中,一维关联方程式、二维关联方程式或三维关联方程式可以为数据质量与信息质量的方程式的变化式,根据各个资源分类数据中包含的关联因子通过关联方程式产生资源分类标注数据。
判断模块400,用于根据同类的资源分类标注数据与初始资料数据确定资源分类标注数据的差异值,还用于判断差异值是否超过预设差异值阈值。
可以理解的是,根据分类模块200已经对初始资料数据进行了分类从而获得了资源分类数据,又根据分类标注模块300获得了资源分类标注数据,由此可以确定同类的资源分类标注数据与初始资料数据;同时,通过资源分类标注数据与初始资料数据可以获得各自相应得语义向量,根据两者的语义向量来确定资源分类标注数据的差异值,而预设差异值阈值可以根据需求或实验所得。通过判断差异值是否超过预设差异值阈值,从而根据判断结果来确定是否继续计算资源分类数据,使得具有自动侦测错误的功能,增加数据检测的准确性
进一步地,该系统还包括:
处理模块,用于对初始资料数据进行缺失值插补处理。
可以理解的是,由于初始资料数据在采集或存储过程中可能会出现数据缺失等问题,通过缺失值插补处理可以补全初始资料数据,从而提高后续数据处理的准确性。
进一步地,该系统还包括:
确定模块,用于确定预先获取的资料数据样本与对应的参数类别之间的映射关系;
可以理解的是,在建立分类标注计算模型之前,需要确定训练样本,而通过预先获取基于本体的资料数据样本与对应的参数类别确定映射关系,从而可以获得具有映射关系的训练样本集。
权重设置模块,用于依据映射关系设置预先获取的资料数据样本与对应的参数类别之间的关联权重值比例;
需要说明的是,由于资料数据样本与多种不同的参数类别都可相关联并建立映射关系,因此,需要根据映射关系设置资料数据样本与对应的参数类别之间的关联权重值比例。
在一个具体实施例中,设定关联权重值比例范围为0~1,将建筑材料因子、厂商因子与技术改造因子关联于成本因子的关联权重值比例设为0.2,将建筑时间因子关联于工程时间因子的关联权重值比例设为0.3,将建筑地理因子关联于地理因子的关联权重值比例设为0.4,将电力设备安装因子关联于设备使用因子的关联权重值比例设为0.25,将电力设备检修因子关联于故障发生因子及故障维修因子的权重值比例设为0.35,将电力调试因子关联于人力分配因子的关联权重值比例设为0.3。
建模模块,用于基于深度学习算法模型建立待训练的权重分类模型,还用于将预先获取的资料数据样本与对应的参数类别以及对应的关联权重值比例输入待训练的权重分类模型中进行训练,从而获得分类标注计算模型。
在本实施例中,将预先获取的资料数据样本与对应的参数类别以及对应的关联权重值比例作为训练样本集输入待训练的权重分类模型中进行训练从而建立具有依据权重分类功能的分类标注计算模型。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以通过一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(英文全称:Read-OnlyMemory,英文缩写:ROM)、随机存取存储器(英文全称:RandomAccess Memory,英文缩写:RAM)、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述,以上实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围。
Claims (6)
1.一种基于本体的资源分类标注方法,其特征在于,包括以下步骤:
S1:根据预设的本体的参数类别从大数据平台中获取初始资料数据;
所述初始资料数据包括工程时间因子、成本因子、人力分配因子、故障发生因子、故障维修因子、地理因子、设备使用因子和厂商因子;
S2:通过预先训练好的分类标注计算模型对所述初始资料数据进行分类,从而获得与所述初始资料数据对应的资源分类数据;
S3:通过所述预先训练好的分类标注计算模型解析所述资源分类数据中与所述预设的本体的参数类别相关联的关联因子,从而获得与所述资源分类数据对应的资源分类标注数据;
所述预设的本体的参数类别包括建筑材料因子、建筑时间因子、建筑地理因子、电力设备安装因子、电力设备检修因子、技术改造因子和电力调试因子;
S4:根据同类的所述资源分类标注数据与所述初始资料数据确定所述资源分类标注数据的差异值,判断所述差异值是否超过预设差异值阈值,若上述判断为是,则执行步骤S2~S4,若上述判断为否,则完成对所述初始资料数据进行分类和标注;
所述步骤S1之后,步骤S2之前包括:
确定预先获取的资料数据样本与对应的参数类别之间的映射关系;
依据所述映射关系设置所述预先获取的资料数据样本与对应的参数类别之间的关联权重值比例;
基于深度学习算法模型建立待训练的权重分类模型,将所述预先获取的资料数据样本与对应的参数类别以及对应的关联权重值比例输入所述待训练的权重分类模型中进行训练,从而获得所述分类标注计算模型。
2.根据权利要求1所述的基于本体的资源分类标注方法,其特征在于,在所述步骤S1之前包括:对所述初始资料数据进行缺失值插补处理。
3.根据权利要求1所述的基于本体的资源分类标注方法,其特征在于,所述资源分类标注数据包括建筑分类标注类别、安装分类标注类别、检修分类标注类别、技改分类标注类别和调试分类标注类别。
4.根据权利要求1所述的基于本体的资源分类标注方法,其特征在于,所述步骤S4中判断所述差异值是否超过预设差异值阈值,若上述判断为是的步骤还包括:通过所述分类标注计算模型生成警报信息。
5.一种基于本体的资源分类标注系统,应用权利要求1所述的基于本体的资源分类标注方法,其特征在于,包括:
获取模块,用于根据预设的本体的参数类别从大数据平台中获取初始资料数据;
所述初始资料数据包括工程时间因子、成本因子、人力分配因子、故障发生因子、故障维修因子、地理因子、设备使用因子和厂商因子;
分类模块,用于通过预先训练好的分类标注计算模型对所述初始资料数据进行分类,从而获得与所述初始资料数据对应的资源分类数据;
分类标注模块,用于通过所述预先训练好的分类标注计算模型解析所述资源分类数据中与所述预设的本体的参数类别相关联的关联因子,从而获得与所述资源分类数据对应的资源分类标注数据;
所述预设的本体的参数类别包括建筑材料因子、建筑时间因子、建筑地理因子、电力设备安装因子、电力设备检修因子、技术改造因子和电力调试因子;
判断模块,用于根据同类的所述资源分类标注数据与所述初始资料数据确定所述资源分类标注数据的差异值,还用于判断所述差异值是否超过预设差异值阈值;
本系统还包括:
确定模块,用于确定预先获取的资料数据样本与对应的参数类别之间的映射关系;
权重设置模块,用于依据所述映射关系设置所述预先获取的资料数据样本与对应的参数类别之间的关联权重值比例;
建模模块,用于基于深度学习算法模型建立待训练的权重分类模型,还用于将所述预先获取的资料数据样本与对应的参数类别以及对应的关联权重值比例输入所述待训练的权重分类模型中进行训练,从而获得所述分类标注计算模型。
6.根据权利要求5所述的基于本体的资源分类标注系统,其特征在于,还包括:
处理模块,用于对所述初始资料数据进行缺失值插补处理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011598805.2A CN112651447B (zh) | 2020-12-29 | 2020-12-29 | 一种基于本体的资源分类标注方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011598805.2A CN112651447B (zh) | 2020-12-29 | 2020-12-29 | 一种基于本体的资源分类标注方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112651447A CN112651447A (zh) | 2021-04-13 |
CN112651447B true CN112651447B (zh) | 2023-09-26 |
Family
ID=75363941
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011598805.2A Active CN112651447B (zh) | 2020-12-29 | 2020-12-29 | 一种基于本体的资源分类标注方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112651447B (zh) |
Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944723A (zh) * | 2017-12-01 | 2018-04-20 | 华中师范大学 | 一种基于本体的土家织锦文化资源分类标注方法及系统 |
CN110196908A (zh) * | 2019-04-17 | 2019-09-03 | 深圳壹账通智能科技有限公司 | 数据分类方法、装置、计算机装置及存储介质 |
WO2020001373A1 (zh) * | 2018-06-26 | 2020-01-02 | 杭州海康威视数字技术股份有限公司 | 一种本体构建方法及装置 |
CN110990576A (zh) * | 2019-12-24 | 2020-04-10 | 用友网络科技股份有限公司 | 基于主动学习的意图分类方法、计算机设备和存储介质 |
WO2020199591A1 (zh) * | 2019-03-29 | 2020-10-08 | 平安科技(深圳)有限公司 | 文本分类模型训练方法、装置、计算机设备及存储介质 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US11893500B2 (en) * | 2017-11-28 | 2024-02-06 | International Business Machines Corporation | Data classification for data lake catalog |
-
2020
- 2020-12-29 CN CN202011598805.2A patent/CN112651447B/zh active Active
Patent Citations (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107944723A (zh) * | 2017-12-01 | 2018-04-20 | 华中师范大学 | 一种基于本体的土家织锦文化资源分类标注方法及系统 |
WO2020001373A1 (zh) * | 2018-06-26 | 2020-01-02 | 杭州海康威视数字技术股份有限公司 | 一种本体构建方法及装置 |
WO2020199591A1 (zh) * | 2019-03-29 | 2020-10-08 | 平安科技(深圳)有限公司 | 文本分类模型训练方法、装置、计算机设备及存储介质 |
CN110196908A (zh) * | 2019-04-17 | 2019-09-03 | 深圳壹账通智能科技有限公司 | 数据分类方法、装置、计算机装置及存储介质 |
CN110990576A (zh) * | 2019-12-24 | 2020-04-10 | 用友网络科技股份有限公司 | 基于主动学习的意图分类方法、计算机设备和存储介质 |
Non-Patent Citations (1)
Title |
---|
基于本体和语义标引的地质资料服务与管理研究;闫 东,王 诚;软件(第9期);第117-121页 * |
Also Published As
Publication number | Publication date |
---|---|
CN112651447A (zh) | 2021-04-13 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN109934356B (zh) | 一种基于大数据的机房巡检方法及相关设备 | |
CN112217207B (zh) | 一种暂态电压稳定裕度预测方法及装置 | |
CN109143094B (zh) | 一种动力电池的异常数据检测方法和装置 | |
CN104537015A (zh) | 一种日志分析的计算机实现的方法、计算机和系统 | |
CN114742477B (zh) | 企业订单数据处理方法、装置、设备及存储介质 | |
CN115440292B (zh) | 存储芯片的测试方法、装置、设备及存储介质 | |
CN113688957A (zh) | 一种基于多模型融合的目标检测方法、装置、设备及介质 | |
CN113298263B (zh) | 计算图处理、模型运行方法及装置、设备、服务器及终端 | |
CN109389518A (zh) | 关联分析方法及装置 | |
CN111931809A (zh) | 数据的处理方法、装置、存储介质及电子设备 | |
CN112348662B (zh) | 基于用户职业预测的风险评估方法、装置和电子设备 | |
CN113205403A (zh) | 一种企业信用等级的计算方法、装置、存储介质及终端 | |
CN114138601A (zh) | 一种业务告警方法、装置、设备及存储介质 | |
CN112783508B (zh) | 文件的编译方法、装置、设备以及存储介质 | |
CN114610608A (zh) | 测试用例处理方法、装置、电子设备以及存储介质 | |
CN117633666A (zh) | 网络资产识别方法、装置、电子设备和存储介质 | |
CN112651447B (zh) | 一种基于本体的资源分类标注方法及系统 | |
Amaral de Almeida et al. | Machine learning method for software quality model building | |
CN109743200B (zh) | 基于资源特征的云计算平台计算任务成本预测方法及系统 | |
CN114205355B (zh) | 一种变电网关附属设备性能测试方法、系统及电子设备 | |
Kusa et al. | Vombat: A tool for visualising evaluation measure behaviour in high-recall search tasks | |
CN111191239B (zh) | 一种用于应用程序的进程检测方法及系统 | |
Gaykar et al. | A Hybrid Supervised Learning Approach for Detection and Mitigation of Job Failure with Virtual Machines in Distributed Environments. | |
CN111722977A (zh) | 系统巡检方法、装置及电子设备 | |
CN117194049B (zh) | 一种基于机器学习算法的云主机智能行为分析方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |