CN115809229A - 一种基于多维数据属性的评估管理方法及系统 - Google Patents
一种基于多维数据属性的评估管理方法及系统 Download PDFInfo
- Publication number
- CN115809229A CN115809229A CN202211650717.1A CN202211650717A CN115809229A CN 115809229 A CN115809229 A CN 115809229A CN 202211650717 A CN202211650717 A CN 202211650717A CN 115809229 A CN115809229 A CN 115809229A
- Authority
- CN
- China
- Prior art keywords
- sets
- occupancy
- attribute
- metadata
- frequency
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明公开了一种基于多维数据属性的评估管理方法及系统,涉及数据处理技术领域,该方法包括:接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合;将多个元数据属性集合输入云占用度空间,得到多个占用度结果;遍历多个占用度分析结果进行否定约束,得到多个约束元数据属性集合;构建多个数据源特征集合;利用T‑SVD方法对多个数据源特征集合进行分解,得到多个奇异值集合;筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合;进行目标数据库管理。本发明解决了现有技术中存在数据库管理效率低,资源分配不合理的技术问题,达到了提高数据库管理合理化程度的技术效果。
Description
技术领域
本发明涉及数据处理技术领域,具体涉及一种基于多维数据属性的评估管理方法及系统。
背景技术
随着信息技术的飞速发展,信息记录的技术手段也在不断发生变化,从最初的纸质文档记录转变为电子存档。通过对电子存档数据进行汇总成数据库,从而方便信息的录用。因此,研究数据库的管理对于提高办公效率有着十分重要的意义。
目前,由于数据库内数据的种类和数量众多,对于库内数据进行统一的资源分配,导致数据搜查速度低,对需求的反映时间比较长,无法及时对需求进行响应。现有技术中存在数据库管理效率低,资源分配不合理的技术问题。
发明内容
本申请提供了一种基于多维数据属性的评估管理方法及系统,用于针对解决现有技术中存在数据库管理效率低,资源分配不合理的技术问题。
鉴于上述问题,本申请提供了一种基于多维数据属性的评估管理方法及系统。
本申请的第一个方面,提供了一种基于多维数据属性的评估管理方法,所述方法包括:
接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合,其中,所述多个元数据属性集合与所述元数据信息一一对应;
将所述多个元数据属性集合输入云占用度空间,得到多个占用度结果,其中,所述占用度结果包括频率维占用度和时间维占用度;
遍历所述多个占用度分析结果进行否定约束,得到多个约束元数据属性集合;
基于所述多个约束元数据属性集合构建多个数据源特征集合,其中,数据源是元数据信息描述的数据对象;
利用T-SVD方法对多个数据源特征集合进行分解,得到多个奇异值集合;
遍历所述多个奇异值集合筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合;
根据所述多个再识别数据源特征集合进行所述目标数据库管理。
本申请的第二个方面,提供了一种基于多维数据属性的评估管理系统,所述系统包括:
属性集合获得模块,所述属性集合获得模块用于接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合,其中,所述多个元数据属性集合与所述元数据信息一一对应;
占用度结果获得模块,所述占用度结果获得模块用于将所述多个元数据属性集合输入云占用度空间,得到多个占用度结果,其中,所述占用度结果包括频率维占用度和时间维占用度;
约束属性集合获得模块,所述约束属性集合获得模块用于遍历所述多个占用度分析结果进行否定约束,得到多个约束元数据属性集合;
数据源特征获得模块,所述数据源特征获得模块用于基于所述多个约束元数据属性集合构建多个数据源特征集合,其中,数据源是元数据信息描述的数据对象;
奇异值获得模块,所述奇异值获得模块用于利用T-SVD方法对多个数据源特征集合进行分解,得到多个奇异值集合;
再识别数据源获得模块,所述再识别数据源获得模块用于遍历所述多个奇异值集合筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合;
数据库管理模块,所述数据库管理模块用于根据所述多个再识别数据源特征集合进行所述目标数据库管理。
本申请中提供的一个或多个技术方案,至少具有如下技术效果或优点:
本申请通过接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合,其中,多个元数据属性集合与元数据信息一一对应,然后将多个元数据属性集合输入云占用度空间,得到多个占用度结果,其中,占用度结果包括频率维占用度和时间维占用度,进而遍历多个占用度分析结果进行否定约束,得到多个约束元数据属性集合,通过基于多个约束元数据属性集合构建多个数据源特征集合,其中,数据源是元数据信息描述的数据对象,然后利用T-SVD方法对多个数据源特征集合进行分解,得到多个奇异值集合,进而遍历多个奇异值集合筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合,然后根据多个再识别数据源特征集合进行目标数据库管理。达到了提高数据管理质量,提高数据管理效率的技术效果。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请实施例提供的一种基于多维数据属性的评估管理方法流程示意图;
图2为本申请实施例提供的一种基于多维数据属性的评估管理方法中得到多个占用度结果的流程示意图;
图3为本申请实施例提供的一种基于多维数据属性的评估管理方法中得到多个约束元数据属性集合的流程示意图;
图4为本申请实施例提供的一种基于多维数据属性的评估管理系统结构示意图。
附图标记说明:属性集合获得模块11,占用度结果获得模块12,约束属性集合获得模块13,数据源特征获得模块14,奇异值获得模块15,再识别数据源获得模块16,数据库管理模块17。
具体实施方式
本申请通过提供了一种基于多维数据属性的评估管理方法,用于针对解决现有技术中存在数据库管理效率低,资源分配不合理的技术问题。
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述。显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动的前提下所获得的所有其他实施例,都属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或服务器不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或模块。
实施例一
如图1所示,本申请提供了一种基于多维数据属性的评估管理方法,所述方法包括:
步骤S100:接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合,其中,所述多个元数据属性集合与所述元数据信息一一对应;
具体而言,所述目标数据库是进行数据管理的任意一个数据库。通过对数据库的数据进行属性提取,从而为后续的数据分析提供基础分析数据。所述多个元数据信息是多个对数据的类型或功能进行描述的数据信息,包括结构化元数据、描述性元数据、管理元数据、业务元数据、技术元数据和操作元数据等。所述多个元数据属性集合是对多个元数据信息进行所述类型属性进行提取得到的,包括结构属性、描述属性、管理属性、业务属性、技术属性和操作属性等。由于所述多个元数据属性集合是对所述多个元数据信息进行属性提取得到的,因此,所述多个元数据属性集合中的属性是与所述元数据信息一一对应。
步骤S200:将所述多个元数据属性集合输入云占用度空间,得到多个占用度结果,其中,所述占用度结果包括频率维占用度和时间维占用度;
进一步的,如图2所示,所述将所述多个元数据属性集合输入云占用度空间,得到多个占用度结果,本申请实施例步骤S200还包括:
步骤S210:获取目标数据库历史调用信息,构建历史调用信息集合,其中,所述历史调用信息集合包括多个历史元数据属性集合、多个历史频率维占用度和多个历史时间维占用度;
步骤S220:将所述多个历史元数据属性集合和所述多个历史频率维度占用度作为第一构建数据集合,构建频率维决策森林;
步骤S230:将所述多个历史元数据属性集合和所述多个历史时间维占用度作为第二构建数据集合,构建时间维决策森林;
步骤S240:将所述频率维决策森林和所述时间维决策森林并联,得到所述云占用度空间。
具体而言,所述云占用度空间是对各个元数据属性在数据库中的占用情况进行智能化计算的空间,包括输入层、频率维决策森林、时间维决策森林和输出层。通过将频率维决策森林和时间维决策森林进行并联,然后将输入层连接在并联结构的前面,输出层连接在并联结构的后面,从而构成所述云占用度空间。输入数据是多个元数据属性集合,输出数据是多个占用度结果。所述多个占用度结果是对多个元数据属性集合中的每个元数据属性在数据库中的占用情况进行描述的结果,包括频率维占用度和时间维占用度。其中,所述频率维占用度是属性使用的频率情况进行描述的占用度。所述时间维占用度是对属性在时间维度上使用情况进行描述的占用度。
具体的,对所述目标数据库的历史调用情况进行提取,得到所述历史调用信息集合。其中,所述历史调用信息集合是对目标数据库在历史时间段内的调用信息进行描述的信息集合,包括多个历史元数据属性集合、多个历史频率维占用度和多个历史时间维占用度。通过将所述多个历史元数据属性集合和所述多个历史频率维度占用度作为第一构建数据集合,用于构建频率维决策森林。其中,所述第一构建数据集合是历史时间段内与数据频率相关的数据,可以对频率维决策森林进行训练构建的数据,包括多个历史元数据属性集合和所述多个历史频率维度占用度。通过将所述多个历史元数据属性集合和所述多个历史时间维占用度作为第二构建数据集合,用于构建时间维决策森林。其中,所述第二构建数据集合是历史时间段内与数据使用时间相关的数据,可以对时间维决策森林进行训练构建的数据,包括多个历史元数据属性集合和所述多个历史时间维占用度。
具体的,所述频率维决策森林是对频率从不同的角度进行分析的智能化模型,包括调取频率决策树、所述存储频率决策树和所述标记频率决策树。其中,所述调取频率决策树是对不同的元数据属性在数据库中调用的频次进行智能化分析的功能决策树。所述存储频率决策树是在数据库中进行存储的数据对应的元数据属性频次进行智能化分析的功能决策树。所述标记频率决策树是对不同元数据属性被用户标记的次数进行智能化分析的决策树,当元数据属性被用户使用的次数不够高,但是被用户重点标记的次数比较多时,仍然需要重点考虑。所述时间维决策森林是对时间从不同角度进行分析的智能化功能模型,包括时长决策树和时间段决策树。其中,所述时长决策树是对元数据属性对应的时间长度进行分析的决策树,所述时间段决策树是对元数据属性调用频次最高的时间段进行分析的决策树。通过将所述频率维决策森林和所述时间维决策森林并联,得到所述云占用度空间。
进一步的,所述将所述多个历史元数据属性集合和所述多个历史频率维度占用度作为第一构建数据集合,构建频率维决策森林,本申请实施例步骤S220还包括:
步骤S221:对所述多个历史元数据属性集合进行数据关联提取,从所述目标数据库的工作日志中提取多个属性调取频率,多个属性存储频率,多个属性标记频率;
步骤S222:根据所述多个历史元数据属性集合和所述多个属性调取频率,构建调取频率决策树;
步骤S223:根据所述多个历史元数据属性集合和所述多个属性存储频率,构建存储频率决策树;
步骤S224:根据所述多个历史元数据属性集合和所述多个属性标记频率,构建标记频率决策树;
步骤S225:根据所述调取频率决策树、所述存储频率决策树和所述标记频率决策树构建所述频率维决策森林。
进一步的,所述根据所述调取频率决策树、所述存储频率决策树和所述标记频率决策树构建所述频率维决策森林,本申请实施例步骤S225还包括;
步骤S2251:将所述多个属性调取频率、所述多个属性存储频率、所述多个属性标记频率和所述多个历史频率维占用度对加权计算层进行训练、验证,得到所述加权计算层;
步骤S2252:将加权计算层嵌于所述频率维决策森林中,与所述调取频率决策树、所述存储频率决策树、所述标记频率决策树交互通信。
具体而言,所述工作日志是目标数据库进行使用的过程中的工作记录数据,通过从工作日志中进行数据提取,可以得到所述多个属性调取频率,多个属性存储频率,多个属性标记频率。其中,多个属性调取频率是对多个历史元数据属性对应的调取次数进行统计得到的。多个属性存储频率是对多个历史元数据属性对应的存储次数进行统计得到的。所述多个属性标记频率是对多个历史元数据属性被用户进行标记的次数进行统计得到的。
具体的,从所述多个属性存储频率中随机选取一属性存储频率作为第一划分节点,对所述多个属性存储频率进行二分类,得到第一划分结果,进而,从多个属性存储频率中随机选取一属性存储频率作为第二划分节点,其中,第一划分节点与第二划分节点对应的属性存储频率不一致,对所述多个属性存储频率进行二分类,得到第二划分结果,进而多次构建多个划分节点,得到划分结果。进而,根据划分结果中的属性存储频率与历史元数据属性集合之间的一一对应关系,按照对应关系根据所述历史元数据属性集合对划分结果进行标记。以所述多个历史元数据属性集合为根节点,以多个划分节点为叶子节点,得到所述调取频率决策树。
具体的,从所述多个属性存储频率中随机选取一属性存储频率作为第一划分节点,对所述多个属性存储频率进行二分类,得到第一划分结果,进而,从多个属性存储频率中随机选取一属性存储频率作为第二划分节点,其中,第一划分节点与第二划分节点对应的属性存储频率不一致,对所述多个属性存储频率进行二分类,得到第二划分结果,进而多次构建多个划分节点,得到划分结果。进而,根据划分结果中的属性存储频率与历史元数据属性集合之间的一一对应关系,按照对应关系根据所述历史元数据属性集合对划分结果进行标记。以所述多个历史元数据属性集合为根节点,以多个划分节点为叶子节点,得到所述存储频率决策树。
具体的,从所述多个属性标记频率中随机选取一属性标记频率作为第一划分节点,对所述多个属性标记频率进行二分类,得到第一划分结果,进而,从多个属性标记频率中随机选取一属性标记频率作为第二划分节点,其中,第一划分节点与第二划分节点对应的属性标记频率不一致,对所述多个属性标记频率进行二分类,得到第二划分结果,进而多次构建多个划分节点,得到划分结果。进而,根据划分结果中的属性标记频率与历史元数据属性集合之间的一一对应关系,按照对应关系根据所述历史元数据属性集合对划分结果进行标记。以所述多个历史元数据属性集合为根节点,以多个划分节点为叶子节点,得到所述标记频率决策树。
具体的,通过将所述多个属性调取频率、所述多个属性存储频率、所述多个属性标记频率和所述多个历史频率维占用度作为历史数据集,按照一定的比例将所述历史数据集分为训练集和验证集。优选的,比例为2:1。利用所述训练集对以BP神经网络为基础的加权计算层进行训练,将其训练至收敛时停止训练。进而,利用验证集,将验证集中的多个属性调取频率、所述多个属性存储频率、所述多个属性标记频率输入所述加权计算层中,得到计算频率维占用度。比较所述计算频率维占用度和验证集中的多个历史频率维占用度,当匹配结果达到60%以上时,表明此时准确度符合要求,得到所述加权计算层。通过将所述加权计算层嵌于所述频率维决策森林中,可以对得到的三个维度的频率进行加权计算。
步骤S300:遍历所述多个占用度分析结果进行否定约束,得到多个约束元数据属性集合;
进一步的,如图3所示,所述遍历所述多个占用度分析结果进行否定约束,得到多个约束元数据属性集合,本申请实施例步骤S300还包括:
步骤S310:遍历所述多个占用度分析结果,提取多个频率维占用度;
步骤S320:设定频率维占用度阈值,将满足所述频率维占用度阈值作为第一否定约束条件;
步骤S330:根据所述第一否定约束条件对所述多个占用度分析结果进行否定约束,得到第一否定约束结果。
进一步的,所述得到第一否定约束结果之后,本申请实施例步骤S330还包括:
步骤S331:遍历所述第一否定约束结果,提取多个时间维占用度,其中,所述多个时间维占用度与所述第一否定约束结果中的占用度分析结果一一对应;
步骤S332:获取用户需求信息并进行解析,得到否定约束时间段;
步骤S333:将满足所述否定约束时间段作为第二否定约束条件;
步骤S334:根据所述第二否定约束条件对所述第一否定约束结果进行否定约束,得到所述多个约束元数据属性集合。
具体而言,所述对所述多个占用度分析结果进行否定约束是指对多个占用度分析结果进行优化筛选,进行一次降维,降低分析数量。所述多个约束元数据属性集合是经过否定约束后值得分析的属性集合。对所述多个占用度分析结果中的频率维占用度进行提取,得到所述多个频率维占用度。其中,所述频率维占用度阈值是频率满足分析要求的最低频率值。第一否定约束条件是对多个占用度分析结果从频率的角度进行约束的条件信息。将所述多个占用度分析结果中低于所述频率维占用度阈值的结果进行剔除,剩下的结果作为所述第一否定约束结果。
具体的,所述用户需求信息是对用户对数据使用的要求进行描述的信息,包括数据类型,使用时间等。所述否定约束时间是根据用户的需求确定的数据调用时间段。所述第二否定约束条件是对多个占用度分析结果从时间上进行约束的条件。通过对所述第一否定约束结果中时间段不在所述第二否定约束条件范围内的占用度分析结果进行筛除,得到所述多个约束元数据属性集合。
步骤S400:基于所述多个约束元数据属性集合构建多个数据源特征集合,其中,数据源是元数据信息描述的数据对象;
具体而言,所述数据源是元数据信息进行描述的数据对应。通过根据所述多个约束元数据属性集合,以及多个约束元数据属性集合与元数据信息之间的对应关系,从而将约束元数据属性作为数据源的特征,得到所述多个数据源特征集合。其中,所述多个数据源特征集合是对数据源的数据特点进行描述的集合。
步骤S500:利用T-SVD方法对多个数据源特征集合进行分解,得到多个奇异值集合;
具体而言,张量奇异值分解(T-SVD)是一种新颖的分解方法,可以通过傅里叶变换把数据从时域搬移到频域,有效分析数据在频域的特征,并可以进行数据压缩。通过利用T-SVD方法对多个数据源特征集合进行分解,进行数据特征计算,得到所述多个奇异值集合。其中,所述多个奇异值集合是对多个数据源特征进行计算得到的数据值,多个奇异值集合与多个数据源特征一一对应。
步骤S600:遍历所述多个奇异值集合筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合;
具体而言,所述预设奇异值是符合用户要求的最低奇异值。对所述多个奇异值集合进行筛选,将低于所述预设奇异值的奇异值集合进行剔除,得到符合要求的多个奇异值集合。进而,根据所述多个奇异值结合与多个数据源特征集合之间的一一对应关系,得到所述多个再识别数据源特征集合,从而对数据源特征集合进行二次降维。所述多个再识别数据源特征集合是从奇异值的角度进行数据筛选后得到。
步骤S700:根据所述多个再识别数据源特征集合进行所述目标数据库管理。
进一步的,所述根据所述多个再识别数据源特征集合进行所述目标数据库管理,本申请实施例步骤S700还包括:
步骤S710:根据所述多个再识别数据源特征集合对应的多个奇异值集合进行序列化排序,得到待调用数据源序列;
步骤S720:根据所述待调用数据源序列获得算力优化方案;
步骤S730:根据所述算力优化方案对所述目标数据库进行管理。
具体而言,根据所述多个再识别数据源特征集合对应的多个奇异值集合进行序列化排序,按照奇异值从大到小的顺序进行排序,得到所述待调用数据源序列。其中,所述待调用数据源序列是对数据源进行调用的次序进行排列后得到队列。通过根据所述待调用数据源序列获得算力优化方案,其中,所述算力优化方案是对数据库的算力分配情况进行优化的方案,排列越靠前,算力分配的越多。由此,实现对数据库的优化管理。
综上所述,本申请实施例至少具有如下技术效果:
本申请实施例通过接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合,实现了对元数据属性进行提取的目标,进而通过将多个元数据属性集合输入云占用度空间,得到多个占用度结果,其中,占用度结果包括频率维占用度和时间维占用度,对多个占用度分析结果从频率和时间两个维度进行否定约束,然后根据约束结果构建多个数据源特征集合,其中,数据源是元数据信息描述的数据对象,通过利用T-SVD方法对多个数据源特征集合进行分解,计算奇异值,为后续对数据源特征进行二次降维提供依据,遍历多个奇异值集合筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合;根据多个再识别数据源特征集合进行目标数据库管理。达到了对数据库进行高效管理,提高管理效率的技术效果。
实施例二
基于与前述实施例中一种基于多维数据属性的评估管理方法相同的发明构思,如图4所示,本申请提供了一种基于多维数据属性的评估管理系统,本申请实施例中的系统与方法实施例基于同样的发明构思。其中,所述系统包括:
属性集合获得模块11,所述属性集合获得模块11用于接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合,其中,所述多个元数据属性集合与所述元数据信息一一对应;
占用度结果获得模块12,所述占用度结果获得模块12用于将所述多个元数据属性集合输入云占用度空间,得到多个占用度结果,其中,所述占用度结果包括频率维占用度和时间维占用度;
约束属性集合获得模块13,所述约束属性集合获得模块13用于遍历所述多个占用度分析结果进行否定约束,得到多个约束元数据属性集合;
数据源特征获得模块14,所述数据源特征获得模块14用于基于所述多个约束元数据属性集合构建多个数据源特征集合,其中,数据源是元数据信息描述的数据对象;
奇异值获得模块15,所述奇异值获得模块15用于利用T-SVD方法对多个数据源特征集合进行分解,得到多个奇异值集合;
再识别数据源获得模块16,所述再识别数据源获得模块16用于遍历所述多个奇异值集合筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合;
数据库管理模块17,所述数据库管理模块17用于根据所述多个再识别数据源特征集合进行所述目标数据库管理。
进一步的,所述系统还包括:
调用信息集合获得单元,所述调用信息集合获得单元用于获取目标数据库历史调用信息,构建历史调用信息集合,其中,所述历史调用信息集合包括多个历史元数据属性集合、多个历史频率维占用度和多个历史时间维占用度;
频率维决策森林构建单元,所述频率维决策森林构建单元用于将所述多个历史元数据属性集合和所述多个历史频率维度占用度作为第一构建数据集合,构建频率维决策森林;
时间维决策森林构建单元,所述时间维决策森林构建单元用于将所述多个历史元数据属性集合和所述多个历史时间维占用度作为第二构建数据集合,构建时间维决策森林;
云占用度空间获得单元,所述云占用度空间获得单元用于将所述频率维决策森林和所述时间维决策森林并联,得到所述云占用度空间。
进一步的,所述系统还包括:
频率提取单元,所述频率提取单元用于对所述多个历史元数据属性集合进行数据关联提取,从所述目标数据库的工作日志中提取多个属性调取频率,多个属性存储频率,多个属性标记频率;
调取频率决策树构建单元,所述调取频率决策树构建单元用于根据所述多个历史元数据属性集合和所述多个属性调取频率,构建调取频率决策树;
存储频率决策树构建单元,所述存储频率决策树构建单元用于根据所述多个历史元数据属性集合和所述多个属性存储频率,构建存储频率决策树;
标记频率决策树构建单元,所述标记频率决策树构建单元用于根据所述多个历史元数据属性集合和所述多个属性标记频率,构建标记频率决策树;
决策森林构建单元,所述决策森林构建单元用于根据所述调取频率决策树、所述存储频率决策树和所述标记频率决策树构建所述频率维决策森林。
进一步的,所述系统还包括;
加权计算层获得单元,所述加权计算层获得单元用于将所述多个属性调取频率、所述多个属性存储频率、所述多个属性标记频率和所述多个历史频率维占用度对加权计算层进行训练、验证,得到所述加权计算层;
交互通信单元,所述交互通信单元用于将加权计算层嵌于所述频率维决策森林中,与所述调取频率决策树、所述存储频率决策树、所述标记频率决策树交互通信。
进一步的,所述系统还包括:
多个频率维占用度提取单元,所述多个频率维占用度提取单元用于遍历所述多个占用度分析结果,提取多个频率维占用度;
第一否定约束条件获得单元,所述第一否定约束条件获得单元用于设定频率维占用度阈值,将满足所述频率维占用度阈值作为第一否定约束条件;
第一否定约束结果获得单元,所述第一否定约束结果获得单元用于根据所述第一否定约束条件对所述多个占用度分析结果进行否定约束,得到第一否定约束结果。
进一步的,所述系统还包括:
多个时间维占用度提取单元,所述多个时间维占用度提取单元用于遍历所述第一否定约束结果,提取多个时间维占用度,其中,所述多个时间维占用度与所述第一否定约束结果中的占用度分析结果一一对应;
否定约束时间段获得单元,所述否定约束时间段获得单元用于获取用户需求信息并进行解析,得到否定约束时间段;
第二否定约束条件设定单元,所述第二否定约束条件设定单元用于将满足所述否定约束时间段作为第二否定约束条件;
多个约束元数据获得单元,所述多个约束元数据获得单元用于根据所述第二否定约束条件对所述第一否定约束结果进行否定约束,得到所述多个约束元数据属性集合。
进一步的,所述系统还包括:
数据源序列获得单元,所述数据源序列获得单元用于根据所述多个再识别数据源特征集合对应的多个奇异值集合进行序列化排序,得到待调用数据源序列;
算力优化方案获得单元,所述算力优化方案获得单元用于根据所述待调用数据源序列获得算力优化方案;
目标数据库管理单元,所述目标数据库管理单元用于根据所述算力优化方案对所述目标数据库进行管理。
需要说明的是,上述本申请实施例先后顺序仅仅为了描述,不代表实施例的优劣。且上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述仅为本申请的较佳实施例,并不用以限制本申请,凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
本说明书和附图仅仅是本申请的示例性说明,且视为已覆盖本申请范围内的任意和所有修改、变化、组合或等同物。显然,本领域的技术人员可以对本申请进行各种改动和变型而不脱离本申请的范围。这样,倘若本申请的这些修改和变型属于本申请及其等同技术的范围之内,则本申请意图包括这些改动和变型在内。
Claims (8)
1.一种基于多维数据属性的评估管理方法,其特征在于,所述方法包括:
接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合,其中,所述多个元数据属性集合与所述元数据信息一一对应;
将所述多个元数据属性集合输入云占用度空间,得到多个占用度结果,其中,所述占用度结果包括频率维占用度和时间维占用度;
遍历所述多个占用度分析结果进行否定约束,得到多个约束元数据属性集合;
基于所述多个约束元数据属性集合构建多个数据源特征集合,其中,数据源是元数据信息描述的数据对象;
利用T-SVD方法对多个数据源特征集合进行分解,得到多个奇异值集合;
遍历所述多个奇异值集合筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合;
根据所述多个再识别数据源特征集合进行所述目标数据库管理。
2.如权利要求1所述的方法,其特征在于,所述将所述多个元数据属性集合输入云占用度空间,得到多个占用度结果,包括:
获取目标数据库历史调用信息,构建历史调用信息集合,其中,所述历史调用信息集合包括多个历史元数据属性集合、多个历史频率维占用度和多个历史时间维占用度;
将所述多个历史元数据属性集合和所述多个历史频率维度占用度作为第一构建数据集合,构建频率维决策森林;
将所述多个历史元数据属性集合和所述多个历史时间维占用度作为第二构建数据集合,构建时间维决策森林;
将所述频率维决策森林和所述时间维决策森林并联,得到所述云占用度空间。
3.如权利要求2所述的方法,其特征在于,所述将所述多个历史元数据属性集合和所述多个历史频率维度占用度作为第一构建数据集合,构建频率维决策森林,包括:
对所述多个历史元数据属性集合进行数据关联提取,从所述目标数据库的工作日志中提取多个属性调取频率,多个属性存储频率,多个属性标记频率;
根据所述多个历史元数据属性集合和所述多个属性调取频率,构建调取频率决策树;
根据所述多个历史元数据属性集合和所述多个属性存储频率,构建存储频率决策树;
根据所述多个历史元数据属性集合和所述多个属性标记频率,构建标记频率决策树;
根据所述调取频率决策树、所述存储频率决策树和所述标记频率决策树构建所述频率维决策森林。
4.如权利要求3所述的方法,其特征在于,所述根据所述调取频率决策树、所述存储频率决策树和所述标记频率决策树构建所述频率维决策森林,所述方法还包括;
将所述多个属性调取频率、所述多个属性存储频率、所述多个属性标记频率和所述多个历史频率维占用度对加权计算层进行训练、验证,得到所述加权计算层;
将加权计算层嵌于所述频率维决策森林中,与所述调取频率决策树、所述存储频率决策树、所述标记频率决策树交互通信。
5.如权利要求1所述的方法,其特征在于,所述遍历所述多个占用度分析结果进行否定约束,得到多个约束元数据属性集合,包括:
遍历所述多个占用度分析结果,提取多个频率维占用度;
设定频率维占用度阈值,将满足所述频率维占用度阈值作为第一否定约束条件;
根据所述第一否定约束条件对所述多个占用度分析结果进行否定约束,得到第一否定约束结果。
6.如权利要求5所述的方法,其特征在于,所述得到第一否定约束结果之后,包括:
遍历所述第一否定约束结果,提取多个时间维占用度,其中,所述多个时间维占用度与所述第一否定约束结果中的占用度分析结果一一对应;
获取用户需求信息并进行解析,得到否定约束时间段;
将满足所述否定约束时间段作为第二否定约束条件;
根据所述第二否定约束条件对所述第一否定约束结果进行否定约束,得到所述多个约束元数据属性集合。
7.如权利要求1所述的方法,其特征在于,所述根据所述多个再识别数据源特征集合进行所述目标数据库管理,包括:
根据所述多个再识别数据源特征集合对应的多个奇异值集合进行序列化排序,得到待调用数据源序列;
根据所述待调用数据源序列获得算力优化方案;
根据所述算力优化方案对所述目标数据库进行管理。
8.一种基于多维数据属性的评估管理系统,其特征在于,所述系统包括:
属性集合获得模块,所述属性集合获得模块用于接收目标数据库的元数据信息进行属性提取,得到多个元数据属性集合,其中,所述多个元数据属性集合与所述元数据信息一一对应;
占用度结果获得模块,所述占用度结果获得模块用于将所述多个元数据属性集合输入云占用度空间,得到多个占用度结果,其中,所述占用度结果包括频率维占用度和时间维占用度;
约束属性集合获得模块,所述约束属性集合获得模块用于遍历所述多个占用度分析结果进行否定约束,得到多个约束元数据属性集合;
数据源特征获得模块,所述数据源特征获得模块用于基于所述多个约束元数据属性集合构建多个数据源特征集合,其中,数据源是元数据信息描述的数据对象;
奇异值获得模块,所述奇异值获得模块用于利用T-SVD方法对多个数据源特征集合进行分解,得到多个奇异值集合;
再识别数据源获得模块,所述再识别数据源获得模块用于遍历所述多个奇异值集合筛选符合预设奇异值的集合,映射得到多个再识别数据源特征集合;
数据库管理模块,所述数据库管理模块用于根据所述多个再识别数据源特征集合进行所述目标数据库管理。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211650717.1A CN115809229A (zh) | 2022-12-21 | 2022-12-21 | 一种基于多维数据属性的评估管理方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211650717.1A CN115809229A (zh) | 2022-12-21 | 2022-12-21 | 一种基于多维数据属性的评估管理方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN115809229A true CN115809229A (zh) | 2023-03-17 |
Family
ID=85486493
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211650717.1A Pending CN115809229A (zh) | 2022-12-21 | 2022-12-21 | 一种基于多维数据属性的评估管理方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115809229A (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956363A (zh) * | 2023-09-20 | 2023-10-27 | 微网优联科技(成都)有限公司 | 一种基于云电脑技术的数据管理方法及系统 |
CN117176545A (zh) * | 2023-11-02 | 2023-12-05 | 江苏益捷思信息科技有限公司 | 基于时间序列分析的数据交换异常检测方法及系统 |
-
2022
- 2022-12-21 CN CN202211650717.1A patent/CN115809229A/zh active Pending
Cited By (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN116956363A (zh) * | 2023-09-20 | 2023-10-27 | 微网优联科技(成都)有限公司 | 一种基于云电脑技术的数据管理方法及系统 |
CN116956363B (zh) * | 2023-09-20 | 2023-12-05 | 微网优联科技(成都)有限公司 | 一种基于云电脑技术的数据管理方法及系统 |
CN117176545A (zh) * | 2023-11-02 | 2023-12-05 | 江苏益捷思信息科技有限公司 | 基于时间序列分析的数据交换异常检测方法及系统 |
CN117176545B (zh) * | 2023-11-02 | 2024-01-26 | 江苏益捷思信息科技有限公司 | 基于时间序列分析的数据交换异常检测方法及系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111444236B (zh) | 一种基于大数据的移动终端用户画像构建方法及系统 | |
CN115809229A (zh) | 一种基于多维数据属性的评估管理方法及系统 | |
CN108363821A (zh) | 一种信息推送方法、装置、终端设备及存储介质 | |
CN109033387A (zh) | 一种融合多源数据的物联网搜索系统、方法及存储介质 | |
CN113064866B (zh) | 一种电力业务数据整合系统 | |
CN101739454B (zh) | 数据处理系统 | |
CN111177559A (zh) | 文旅服务推荐方法、装置、电子设备及存储介质 | |
CN115641162A (zh) | 一种基于建筑工程造价的预测数据分析系统和方法 | |
CN110704738B (zh) | 基于法官画像的服务信息推送方法、装置、终端及存储介质 | |
CN111339052A (zh) | 一种非结构化日志数据处理方法及装置 | |
KR102345410B1 (ko) | 빅데이터 지능형 수집 방법 및 장치 | |
CN112100177A (zh) | 数据存储方法、装置、计算机设备及存储介质 | |
CN114048854B (zh) | 一种深度神经网络大数据内部数据文件的管理方法 | |
CN110826845A (zh) | 一种多维组合成本分摊装置及方法 | |
CN109684479A (zh) | 一种基于人工智能来实现业务分析的方法 | |
CN112306421B (zh) | 一种用于存储分析测量数据格式mdf文件的方法和系统 | |
CN114330720A (zh) | 用于云计算的知识图谱构建方法、设备及存储介质 | |
CN114265887A (zh) | 一种维度数据处理方法、装置、存储介质及电子设备 | |
CN109493249B (zh) | 一种用电数据在多时间尺度上的分析方法 | |
CN107577690B (zh) | 海量信息数据的推荐方法及推荐装置 | |
CN112308419A (zh) | 数据处理方法、装置、设备及计算机存储介质 | |
CN117251532B (zh) | 一种基于动态多级匹配的大规模文献机构消歧方法 | |
CN110737731B (zh) | 一种基于决策树的公积金用户数据细化分析系统及方法 | |
CN110909818B (zh) | 一种基于tbox的整车运行数据的降维系统 | |
CN116993307A (zh) | 一种具有人工智能学习能力的协同办公方法及系统 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |