CN116578568A - 基于人工智能的数据优化存储方法及大数据系统 - Google Patents

基于人工智能的数据优化存储方法及大数据系统 Download PDF

Info

Publication number
CN116578568A
CN116578568A CN202310847276.2A CN202310847276A CN116578568A CN 116578568 A CN116578568 A CN 116578568A CN 202310847276 A CN202310847276 A CN 202310847276A CN 116578568 A CN116578568 A CN 116578568A
Authority
CN
China
Prior art keywords
detection data
software detection
authenticated
software
storage
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310847276.2A
Other languages
English (en)
Other versions
CN116578568B (zh
Inventor
蒋天宏
田凯
孙凤英
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Octopus Artificial Intelligence Technology Changshu Co ltd
Original Assignee
Octopus Artificial Intelligence Technology Changshu Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Octopus Artificial Intelligence Technology Changshu Co ltd filed Critical Octopus Artificial Intelligence Technology Changshu Co ltd
Priority to CN202310847276.2A priority Critical patent/CN116578568B/zh
Publication of CN116578568A publication Critical patent/CN116578568A/zh
Application granted granted Critical
Publication of CN116578568B publication Critical patent/CN116578568B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F11/00Error detection; Error correction; Monitoring
    • G06F11/36Preventing errors by testing or debugging software
    • G06F11/3668Software testing
    • G06F11/3672Test management
    • G06F11/3692Test management for test results analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/258Data format conversion from or to a database
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Probability & Statistics with Applications (AREA)
  • Mathematical Physics (AREA)
  • Fuzzy Systems (AREA)
  • Computer Hardware Design (AREA)
  • Quality & Reliability (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Machine Translation (AREA)
  • Debugging And Monitoring (AREA)

Abstract

本申请实施例提供的基于人工智能的数据优化存储方法及大数据系统,鉴于完成调试的检测报告语义挖掘网络是结合多维度学习特征调试所得的,因此可以保障所得到的软件缺陷‑修复文本语义对的完整性和匹配性,以减少软件缺陷‑修复文本语义对出现偏差和混乱的概率。这样一来,通过软件缺陷‑修复文本语义对进行选定软件检测数据的结构化存储决策观点确定,能够提升结构化存储决策观点确定的精度和可信度,从而基于结构化存储决策观点对选定软件检测数据进行准确高效的结构化转换,进而实现结构化的存储优化。

Description

基于人工智能的数据优化存储方法及大数据系统
技术领域
本申请涉及人工智能技术领域,特别涉及一种基于人工智能的数据优化存储方法及大数据系统。
背景技术
软件测试/检测,是完整软件开发项目中的最后环节之一,也是相当重要的环节。通过软件测试/检测,能够知晓应用软件/程序是否符合标准,或者还有哪些方面需要修改和优化。因此,软件测试/检测所得到的数据信息具有一定的参考意义,通过将软件测试/检测所得到的数据信息进行存储,能够便于后期调用。然而,随着软件测试/检测数据信息的使用需求的不断变化,传统的存储方式存在调用效率低下的问题。在此基础上,对软件测试/检测数据信息进行存储优化至关重要。
发明内容
为改善相关技术中存在的技术问题,本申请提供了一种基于人工智能的数据优化存储方法及大数据系统。
第一方面,本申请实施例提供了一种基于人工智能的数据优化存储方法,应用于大数据系统,所述方法包括:响应于针对软件检测数据的存储优化请求,获取拟进行存储优化处理的选定软件检测数据;
通过完成调试的检测报告语义挖掘网络,得到所述选定软件检测数据的软件缺陷-修复文本语义对,其中,所述完成调试的检测报告语义挖掘网络是结合多维度学习特征调试所得的;
通过所述软件缺陷-修复文本语义对,确定所述选定软件检测数据的结构化存储决策观点。
在一些可选的实施例中,所述完成调试的检测报告语义挖掘网络的调试步骤包括:
获取包括若干个已认证软件检测数据的软件检测学习数据集合,所述软件检测学习数据集合中包括各所述已认证软件检测数据的先验结构化存储建议观点;
将所述软件检测学习数据集合中的各所述已认证软件检测数据加载到待调试的深度结构化语义网络中,得到各所述已认证软件检测数据的软件缺陷-修复文本语义对;
针对每个设定存储优化决策观点,依据所述软件检测学习数据集合中属于该设定存储优化决策观点的已认证软件检测数据的软件缺陷-修复文本语义对,确定各设定存储优化决策观点的观点描述知识;
针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分;
通过各所述已认证软件检测数据的先验结构化存储建议观点、存储优化执行评分、软件缺陷-修复文本语义对以及各所述设定存储优化决策观点的观点描述知识,对所述待调试的深度结构化语义网络的网络变量进行改进,直到所述深度结构化语义网络的调试代价变量符合调试终止要求,抽取调试所得的深度结构化语义网络中的深度可逆残差组件作为检测报告语义挖掘网络。
在一些可选的实施例中,针对每个所述已认证软件检测数据,所述通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分,包括:
确定该已认证软件检测数据的软件缺陷-修复文本语义对与第一存储优化决策观点的观点描述知识之间的第一特征差异度量,所述第一存储优化决策观点为任一所述设定存储优化决策观点;
依据预设特征差异度量,更新所述第一特征差异度量;
确定所述第一特征差异度量更新之前,该已认证软件检测数据的软件缺陷-修复学习语义对与所述第一存储优化决策观点的观点描述知识之间的第一共性指数、以及所述第一特征差异度量更新之后,该已认证软件检测数据的软件缺陷-修复文本语义对与所述第一存储优化决策观点的观点描述知识之间的第二共性指数;
如果所述第一共性指数不大于所述第二共性指数,确定所述已认证软件检测数据的存储优化执行评分为第一执行评分,如果所述第一共性指数大于所述第二共性指数,确定所述已认证软件检测数据的存储优化执行评分为第二执行评分。
在一些可选的实施例中,所述第一共性指数为所述第一特征差异度量的目标值,所述第二共性指数为完成更新的第一特征差异度量的目标值。
在一些可选的实施例中,所述通过各所述已认证软件检测数据的先验结构化存储建议观点、存储优化执行评分、软件缺陷-修复文本语义对以及各所述设定存储优化决策观点的观点描述知识,对所述待调试的深度结构化语义网络的网络变量进行改进,包括:
针对每个所述已认证软件检测数据,通过该已认证软件检测数据的存储优化执行评分确定该已认证软件检测数据的结构化处理权重;
通过各已认证软件检测数据的先验结构化存储建议观点、结构化处理权重、软件缺陷-修复文本语义对以及所述各设定存储优化决策观点的观点描述知识,确定所述调试代价变量;
如果所述调试代价变量不符合调试终止要求,则依据所述调试代价变量,对所述待调试的深度结构化语义网络的网络变量进行改进。
在一些可选的实施例中,每个已认证软件检测数据的存储优化执行评分为第一执行评分或第二执行评分,所述通过该已认证软件检测数据的存储优化执行评分确定该已认证软件检测数据的结构化处理权重,包括:
如果该已认证软件检测数据的存储优化执行评分为第一执行评分,则将该已认证软件检测数据的结构化处理权重确定为预设权重;
如果该已认证软件检测数据的存储优化执行评分为第二执行评分,则通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重;其中,所述各待处理存储优化决策观点为各设定存储优化决策观点中除该已认证软件检测数据的先验结构化存储建议观点以外的存储优化决策观点。
在一些可选的实施例中,所述通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重,包括:
通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识,确定该已认证软件检测数据相对于各所述待处理存储优化决策观点的存储优化执行评分;
将对应的存储优化执行评分为第二执行评分的待处理存储优化决策观点作为第二存储优化决策观点;
通过该已认证软件检测数据的软件缺陷-修复文本语义对与各第二执行评分的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重。
在一些可选的实施例中,所述通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识,确定该已认证软件检测数据相对于各所述待处理存储优化决策观点的存储优化执行评分,包括:
针对每个所述待处理存储优化决策观点,确定该已认证软件检测数据的软件缺陷-修复文本语义对与该待处理存储优化决策观点的观点描述知识之间的第二特征差异度量;
依据预设特征差异度量,更新所述第二特征差异度量;
确定所述第二特征差异度量更新之前,该已认证软件检测数据的软件缺陷-修复学习语义对与该待处理存储优化决策观点的观点代表特征之间的第三共性指数、以及所述第二特征差异度量更新之后,该已认证软件检测数据的软件缺陷-修复学习语义对与该待处理存储优化决策观点的观点代表特征之间的第四共性指数;
如果所述第三共性指数大于所述第四共性指数,确定该已认证软件检测数据相对于该待处理存储优化决策观点的存储优化执行评分为第二执行评分。
在一些可选的实施例中,所述通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重,包括:
通过该已认证软件检测数据的软件缺陷-修复文本语义对和各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的权重修改因子;
依据所述权重修改因子对所述预设权重进行改进,得到该已认证软件检测数据的结构化处理权重,其中,所述结构化处理权重不小于所述预设权重。
在一些可选的实施例中,所述依据所述权重修改因子对预设权重进行改进,得到该已认证软件检测数据的结构化处理权重,包括:将所述权重修改因子与所述预设权重的和确定为该已认证软件检测数据的结构化处理权重。
在一些可选的实施例中,所述调试代价变量是基于交叉熵的调试代价变量,所述基于交叉熵的调试代价变量是通过如下步骤确定的:
将每个所述已认证软件检测数据的存储优化执行评分作为该已认证软件检测数据对应的交叉熵;
通过各所述已认证软件检测数据的先验结构化存储建议观点、交叉熵、软件缺陷-修复文本语义对以及所述各设定存储优化决策观点的观点描述知识,确定所述基于交叉熵的调试代价变量。
在一些可选的实施例中,所述深度结构化语义网络包括观点判别处理组件,所述深度可逆残差组件和所述观点判别处理组件相连,所述方法还包括:
针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对,通过所述观点判别处理组件确定该已认证软件检测数据在各所述设定存储优化决策观点中所属的存储优化预测观点;
基于每个所述已认证软件检测数据对应的存储优化预测观点,确定第一机器学习数据集和第二机器学习数据集,所述第一机器学习数据集包括所述软件检测学习数据集合中先验结构化存储建议观点与存储优化预测观点相同的已认证软件检测数据,所述第二机器学习数据集为所述软件检测学习数据集合中除第一机器学习数据集以外的已认证软件检测数据;
所述针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分,包括:
对于所述第二机器学习数据集中的每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分。
第二方面,本申请还提供了一种大数据系统,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现上述的方法。
第三方面,本申请还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
根据本申请实施例提供的基于人工智能的数据优化存储方法及大数据系统,响应于针对软件检测数据的存储优化请求,获取拟进行存储优化处理的选定软件检测数据;通过完成调试的检测报告语义挖掘网络,得到选定软件检测数据的软件缺陷-修复文本语义对,通过软件缺陷-修复文本语义对,确定选定软件检测数据的结构化存储决策观点。鉴于完成调试的检测报告语义挖掘网络是结合多维度学习特征调试所得的,因此可以保障所得到的软件缺陷-修复文本语义对的完整性和匹配性,以减少软件缺陷-修复文本语义对出现偏差和混乱的概率。这样一来,通过软件缺陷-修复文本语义对进行选定软件检测数据的结构化存储决策观点确定,能够提升结构化存储决策观点确定的精度和可信度,从而基于结构化存储决策观点对选定软件检测数据进行准确高效的结构化转换,进而实现结构化的存储优化。
该方法在调试过程中,针对每个设定存储优化决策观点,可以根据软件检测学习数据集合中属于该设定存储优化决策观点的已认证软件检测数据的软件缺陷-修复文本语义对,确定该设定存储优化决策观点的观点描述知识。针对每个已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分,并根据各已认证软件检测数据的先验结构化存储建议观点、存储优化执行评分、软件缺陷-修复文本语义对以及各设定存储优化决策观点的观点描述知识,对待调试的深度结构化语义网络的网络变量进行改进,直到深度结构化语义网络的调试代价变量符合调试终止要求,抽取调试所得的深度结构化语义网络中的深度可逆残差组件作为检测报告语义挖掘网络,如此,在通过软件检测学习数据集合进行深度结构化语义网络的调试时,可以综合各个已认证软件检测数据的存储优化执行顺利程度以及各设定存储优化决策观点的观点描述知识,对待调试的深度结构化语义网络进行网络调试更新,提高了调试所得的检测报告语义挖掘网络提取软件缺陷-修复文本语义对的准确性,进而在通过该软件缺陷-修复文本语义对进行结构化存储决策观点确定时,能够提升结构化存储决策观点确定的精度和可信度,以便为软件检测数据的存储优化提供结构化转换的指导和参考。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并于说明书一起用于解释本申请的原理。
图1是本申请实施例提供的一种基于人工智能的数据优化存储方法的流程示意图。
具体实施方式
这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。
需要说明的是,本申请的说明书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
本申请实施例所提供的方法实施例可以在大数据系统、计算机设备或者类似的运算装置中执行。以运行在大数据系统上为例,大数据系统可以包括一个或多个处理器(处理器可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)和用于存储数据的存储器,可选地,上述大数据系统还可以包括用于通信功能的传输装置。本领域普通技术人员可以理解,上述结构仅为示意,其并不对上述大数据系统的结构造成限定。例如,大数据系统还可包括比上述所示更多或者更少的组件,或者具有与上述所示不同的配置。
存储器可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本申请实施例中的一种基于人工智能的数据优化存储方法对应的计算机程序,处理器通过运行存储在存储器内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至大数据系统。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置用于经由一个网络接收或者发送数据。上述的网络具体实例可包括大数据系统的通信供应商提供的无线网络。在一个实例中,传输装置包括一个网络适配器(Network Interface Controller,简称为NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置可以为射频(Radio Frequency,简称为RF)模块,其用于通过无线方式与互联网进行通讯。
基于此,请参阅图1,图1是本申请实施例所提供的一种基于人工智能的数据优化存储方法的流程示意图,该方法应用于大数据系统,进一步可以包括S101-S103。
S101、响应于针对软件检测数据的存储优化请求,获取拟进行存储优化处理的选定软件检测数据。
本申请实施例中,存储优化请求可以是结构化数据库向大数据系统发起的,在此基础上,大数据系统根据存储优化请求可以获得拟进行存储优化处理的选定软件检测数据,选定软件检测数据中包括应用软件程序的单元测试数据、模块测试数据、集成测试数据、系统测试数据、回归测试数据、冒烟测试数据、验收测试数据、静态测试数据、动态测试数据、自动化测试数据等。当然,本领域技术人员可以根据实际需求灵活增减选定软件检测数据中所包含的内容。
S102、通过完成调试的检测报告语义挖掘网络,得到所述选定软件检测数据的软件缺陷-修复文本语义对,其中,所述完成调试的检测报告语义挖掘网络是结合多维度学习特征调试所得的。
本申请实施例中,检测报告语义挖掘网络(可以是深度结构化语义网络)用于对选定软件检测数据进行文本特征挖掘,从而得到软件缺陷-修复文本语义对。其中,软件缺陷-修复文本语义对包括软件缺陷记录的语义特征和软件修复记录的语义特征,软件缺陷-修复文本语义对用于表征相关软件缺陷及其对应的修复行为的对应关系,因此软件缺陷-修复文本语义对还可以理解为软件缺陷-修复文本语义二元组,可以通过特征向量的形式进行表示。
S103、通过所述软件缺陷-修复文本语义对,确定所述选定软件检测数据的结构化存储决策观点。
本申请实施例中,结构化存储决策观点用于指导选定软件检测数据的结构化转换,比如指出选定软件检测数据中不同数据集的结构目录化模式,或者指示对选定软件检测数据中的哪部分数据集进行树状结构化转换,然后又对哪部分数据集进行辐射状结构化转换等。
譬如,所述通过所述软件缺陷-修复文本语义对,确定所述选定软件检测数据的结构化存储决策观点,可以包括:将所述软件缺陷-修复文本语义对输入存储决策处理模型,获得所述存储决策处理模型输出的所述选定软件检测数据的结构化存储决策观点。
本申请实施例中,存储决策处理模型可以是多分类器,用于对软件缺陷-修复文本语义对进行多分类处理,从而得到软件缺陷-修复文本语义对应的分类标签(也即结构化存储决策观点)。存储决策处理模型同样可以通过训练样本训练得到,存储决策处理模型的训练样本可以与软件缺陷-修复文本语义对类似。
又譬如,存储决策处理模型可以将软件缺陷-修复文本语义对进行特征分割以获得多个特征块,然后针对每个特征块进行分类处理,得到每个特征块的局部分类标签,并将这些局部分类标签进行汇总以得到结构化存储决策观点。结合上述示例,结构化存储决策观点可以包括用于指示对选定软件检测数据中的哪部分数据集进行树状结构化转换的局部分类标签tag1,以及用于指示对哪部分数据集进行辐射状结构化转换的局部分类标签tag2。
可见,应用S101-S103,鉴于完成调试的检测报告语义挖掘网络是结合多维度学习特征调试所得的,因此可以保障所得到的软件缺陷-修复文本语义对的完整性和匹配性,以减少软件缺陷-修复文本语义对出现偏差和混乱的概率。这样一来,通过软件缺陷-修复文本语义对进行选定软件检测数据的结构化存储决策观点确定,能够提升结构化存储决策观点确定的精度和可信度,从而基于结构化存储决策观点对选定软件检测数据进行准确高效的结构化转换,进而实现结构化的存储优化。在实现选定软件检测数据的存储优化之后,可以提高后期数据调用和访问的时效性,从而提高数据调用效率。
在一些可选的实施例中,所述完成调试的检测报告语义挖掘网络的调试步骤包括S1021-S1025所描述的技术方案。
S1021、获取包括若干个已认证软件检测数据的软件检测学习数据集合,所述软件检测学习数据集合中包括各所述已认证软件检测数据的先验结构化存储建议观点。
本申请实施例中,已认证软件检测数据可以理解为软件检测数据的样本或者样例,已认证软件检测数据用于实现检测报告语义挖掘网络的调试训练。基于此,软件检测学习数据集合可以理解为软件检测数据的样本集合。进一步地,已认证软件检测数据的先验结构化存储建议观点是已认证软件检测数据的真实结构化存储决策观点,也可以理解为真实的标注标签。
S1022、将所述软件检测学习数据集合中的各所述已认证软件检测数据加载到待调试的深度结构化语义网络中,得到各所述已认证软件检测数据的软件缺陷-修复文本语义对。
本申请实施例中,待调试的深度结构化语义网络为初始的、未训练的深度结构化语义网络。
S1023、针对每个设定存储优化决策观点,依据所述软件检测学习数据集合中属于该设定存储优化决策观点的已认证软件检测数据的软件缺陷-修复文本语义对,确定各设定存储优化决策观点的观点描述知识。
其中,设定存储优化决策观点可以理解未预设的存储优化决策观点,观点描述知识用于表征设定存储优化决策观点的存储优化决策观点特征。
S1024、针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分。
进一步地,存储优化执行评分用于表征已认证软件检测数据在进行结构化转换过程中的复杂程度或者难以程度,存储优化执行评分越低,表明已认证软件检测数据在进行结构化转换过程中的复杂程度越高,结构化转换难度大;存储优化执行评分越高,表明已认证软件检测数据在进行结构化转换过程中的复杂程度越低,结构化转换难度小。
S1025、通过各所述已认证软件检测数据的先验结构化存储建议观点、存储优化执行评分、软件缺陷-修复文本语义对以及各所述设定存储优化决策观点的观点描述知识,对所述待调试的深度结构化语义网络的网络变量进行改进,直到所述深度结构化语义网络的调试代价变量符合调试终止要求,抽取调试所得的深度结构化语义网络中的深度可逆残差组件作为检测报告语义挖掘网络。
可以理解,该方法在调试过程中,针对每个设定存储优化决策观点,可以根据软件检测学习数据集合中属于该设定存储优化决策观点的已认证软件检测数据的软件缺陷-修复文本语义对,确定该设定存储优化决策观点的观点描述知识。针对每个已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分,并根据各已认证软件检测数据的先验结构化存储建议观点、存储优化执行评分、软件缺陷-修复文本语义对以及各设定存储优化决策观点的观点描述知识,对待调试的深度结构化语义网络的网络变量进行改进,直到深度结构化语义网络的调试代价变量符合调试终止要求,抽取调试所得的深度结构化语义网络中的深度可逆残差组件作为检测报告语义挖掘网络,如此,在通过软件检测学习数据集合进行深度结构化语义网络的调试时,可以综合各个已认证软件检测数据的存储优化执行顺利程度以及各设定存储优化决策观点的观点描述知识,对待调试的深度结构化语义网络进行网络调试更新,提高了调试所得的检测报告语义挖掘网络提取软件缺陷-修复文本语义对的准确性,进而在通过该软件缺陷-修复文本语义对进行结构化存储决策观点确定时,能够提升结构化存储决策观点确定的精度和可信度,以便为软件检测数据的存储优化提供结构化转换的指导和参考。
在一些示例性实施例中,针对每个所述已认证软件检测数据,S1024中的通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分,包括S10241-S10244。
S10241、确定该已认证软件检测数据的软件缺陷-修复文本语义对与第一存储优化决策观点的观点描述知识之间的第一特征差异度量,所述第一存储优化决策观点为任一所述设定存储优化决策观点。
本申请实施例中,第一特征差异度量用于表征该已认证软件检测数据的软件缺陷-修复文本语义对与第一存储优化决策观点的观点描述知识之间的特征区别/距离。
S10242、依据预设特征差异度量,更新所述第一特征差异度量。
其中,更新所述第一特征差异度量可以是将第一特征差异度量进行增大处理。
S10243、确定所述第一特征差异度量更新之前,该已认证软件检测数据的软件缺陷-修复学习语义对与所述第一存储优化决策观点的观点描述知识之间的第一共性指数、以及所述第一特征差异度量更新之后,该已认证软件检测数据的软件缺陷-修复文本语义对与所述第一存储优化决策观点的观点描述知识之间的第二共性指数。
本申请实施例中,共性指数可以理解为相应(更新前后)软件缺陷-修复学习语义对与第一存储优化决策观点的相似性,比如可以是余弦相似度。
S10244、如果所述第一共性指数不大于所述第二共性指数,确定所述已认证软件检测数据的存储优化执行评分为第一执行评分,如果所述第一共性指数大于所述第二共性指数,确定所述已认证软件检测数据的存储优化执行评分为第二执行评分。
在本申请实施例中,第一执行评分和第二执行评分用于表征已认证软件检测数据不同等级下的存储优化执行评分,可以反映已认证软件检测数据在进行结构化转换时的难以程度。进一步地,如果第一共性指数不大于第二共性指数,则表明修改前后的软件缺陷-修复文本语义对存在较大变化,在此基础上,可以认为已认证软件检测数据的结构化转换难度偏高,也即第一执行评分偏低。基于此,可以认为第二执行评分高于第一执行评分。
可以理解,应用S10241-S10244,通过引入特征差异度量的更新处理进行共性指数的确定,能够将已认证软件检测数据的特征变化考虑在内,这样可以准确、可靠地确定出已认证软件检测数据的存储优化执行评分。
在一些可能的示例下,所述第一共性指数为所述第一特征差异度量的目标值,所述第二共性指数为完成更新的第一特征差异度量的目标值。其中,该目标值可以理解为余弦值。
在一些可选的实施例中,S1025中的通过各所述已认证软件检测数据的先验结构化存储建议观点、存储优化执行评分、软件缺陷-修复文本语义对以及各所述设定存储优化决策观点的观点描述知识,对所述待调试的深度结构化语义网络的网络变量进行改进,包括S10251-S10253。
S10251、针对每个所述已认证软件检测数据,通过该已认证软件检测数据的存储优化执行评分确定该已认证软件检测数据的结构化处理权重。
本申请实施例中,结构化处理权重用于表征已认证软件检测数据在进行结构化变换处理时的难易系数,结构化处理权重的取值范围可以在0~1之间。
S10252、通过各已认证软件检测数据的先验结构化存储建议观点、结构化处理权重、软件缺陷-修复文本语义对以及所述各设定存储优化决策观点的观点描述知识,确定所述调试代价变量。
本申请实施例中,调试代价变量用于表征待调试的深度结构化语义网络的训练损失值。
S10253、如果所述调试代价变量不符合调试终止要求,则依据所述调试代价变量,对所述待调试的深度结构化语义网络的网络变量进行改进。
本申请实施例中,调试终止要求可以是训练完成条件,比如可以是损失函数收敛,或者训练次数达到设定次数。这样一来,通过确定已认证软件检测数据的结构化处理权重,并进行待调试的深度结构化语义网络的网络变量改进,能够提高调试所得的检测报告语义挖掘网络提取软件缺陷-修复文本语义对的准确性,进而在通过该软件缺陷-修复文本语义对进行结构化存储决策观点确定时,能够提升结构化存储决策观点确定的精度和可信度,以便为软件检测数据的存储优化提供结构化转换的指导和参考。
在一些示例下,每个已认证软件检测数据的存储优化执行评分为第一执行评分或第二执行评分。基于此,S10251中的所述通过该已认证软件检测数据的存储优化执行评分确定该已认证软件检测数据的结构化处理权重,包括S10251a和S10251b。
S10251a、如果该已认证软件检测数据的存储优化执行评分为第一执行评分,则将该已认证软件检测数据的结构化处理权重确定为预设权重。
本申请实施例中,可以根据预设的映射关系确定已认证软件检测数据的结构化处理权重,比如该已认证软件检测数据的存储优化执行评分为第一执行评分的情况下,可以根据映射关系确定结构化处理权重为预设权重。
S10251b、如果该已认证软件检测数据的存储优化执行评分为第二执行评分,则通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重。其中,所述各待处理存储优化决策观点为各设定存储优化决策观点中除该已认证软件检测数据的先验结构化存储建议观点以外的存储优化决策观点。
可以理解,通过S10251a和S10251b,在确定结构化处理权重时,能够根据不同执行评分进行不同分支的结构化处理权重确定,这样可以准确可靠地确定出结构化处理权重。
在一些示例性实施例中,S10251b中的通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重,包括步骤001-步骤003。
步骤001、通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识,确定该已认证软件检测数据相对于各所述待处理存储优化决策观点的存储优化执行评分。
步骤002、将对应的存储优化执行评分为第二执行评分的待处理存储优化决策观点作为第二存储优化决策观点。
步骤003、通过该已认证软件检测数据的软件缺陷-修复文本语义对与各第二执行评分的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重。
通过实施步骤001-步骤003,能够引入软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识准确确定该已认证软件检测数据相对于各所述待处理存储优化决策观点的存储优化执行评分,在此基础上确定出第二存储优化决策观点,从而通过该已认证软件检测数据的软件缺陷-修复文本语义对与各第二执行评分的观点描述知识之间的共性指数准确确定已认证软件检测数据的结构化处理权重。
在一些示例性设计思路下,步骤001中的通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识,确定该已认证软件检测数据相对于各所述待处理存储优化决策观点的存储优化执行评分,包括步骤0011-步骤0014。
步骤0011、针对每个所述待处理存储优化决策观点,确定该已认证软件检测数据的软件缺陷-修复文本语义对与该待处理存储优化决策观点的观点描述知识之间的第二特征差异度量。
步骤0012、依据预设特征差异度量,更新所述第二特征差异度量。
步骤0013、确定所述第二特征差异度量更新之前,该已认证软件检测数据的软件缺陷-修复学习语义对与该待处理存储优化决策观点的观点代表特征之间的第三共性指数、以及所述第二特征差异度量更新之后,该已认证软件检测数据的软件缺陷-修复学习语义对与该待处理存储优化决策观点的观点代表特征之间的第四共性指数。
步骤0014、如果所述第三共性指数大于所述第四共性指数,确定该已认证软件检测数据相对于该待处理存储优化决策观点的存储优化执行评分为第二执行评分。
本申请实施例中,观点代表特征可以理解为待处理存储优化决策观点的中心特征或者显著特征,基于此,可以引入观点代表特征进行共性指数确定,从而准确确定出该已认证软件检测数据相对于各所述待处理存储优化决策观点的存储优化执行评分。
在一些示例性实施例中,S10251b中的所述通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重,包括S001和S002。
S001、通过该已认证软件检测数据的软件缺陷-修复文本语义对和各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的权重修改因子。
本申请实施例中,权重修改因子用于指示结构化处理权重的修改和修正。
S002、依据所述权重修改因子对所述预设权重进行改进,得到该已认证软件检测数据的结构化处理权重,其中,所述结构化处理权重不小于所述预设权重。
如此一来,通过引入权重修改因子进行预设权重的改进,能够进一步提高结构化处理权重的精度。
在另一些可能的实施例中,所述依据所述权重修改因子对预设权重进行改进,得到该已认证软件检测数据的结构化处理权重,包括:将所述权重修改因子与所述预设权重的和确定为该已认证软件检测数据的结构化处理权重。
在一些示例下,所述调试代价变量是基于交叉熵的调试代价变量,所述基于交叉熵的调试代价变量是通过如下步骤确定的:将每个所述已认证软件检测数据的存储优化执行评分作为该已认证软件检测数据对应的交叉熵;通过各所述已认证软件检测数据的先验结构化存储建议观点、交叉熵、软件缺陷-修复文本语义对以及所述各设定存储优化决策观点的观点描述知识,确定所述基于交叉熵的调试代价变量。这样一来,能够引入交叉熵进行调试代价变量的确定,从而保障调试代价变量的准确性和可靠性。
在一些示例下,所述深度结构化语义网络包括观点判别处理组件(可以理解为分类组件),所述深度可逆残差组件(可以理解为特征提取组件)和所述观点判别处理组件相连。基于此,所述方法还包括NODE1和NODE2。
NODE1、针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对,通过所述观点判别处理组件确定该已认证软件检测数据在各所述设定存储优化决策观点中所属的存储优化预测观点。
NODE2、基于每个所述已认证软件检测数据对应的存储优化预测观点,确定第一机器学习数据集和第二机器学习数据集,所述第一机器学习数据集包括所述软件检测学习数据集合中先验结构化存储建议观点与存储优化预测观点相同的已认证软件检测数据,所述第二机器学习数据集为所述软件检测学习数据集合中除第一机器学习数据集以外的已认证软件检测数据。
这样一来,可以通过确定存储优化预测观点,进一步实现第一机器学习数据集和第二机器学习数据集的区分处理,从而为之后的网络调试提供准确可靠的数据基础。
进一步地,S1024中的针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分,包括:对于所述第二机器学习数据集中的每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分。这样一来,可以利用区分得到的第二机器学习数据集准确确定已认证软件检测数据的存储优化执行评分。
进一步地,还提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现上述的方法。
在本申请实施例所提供的几个实施例中,应该理解到,所揭露的装置和方法,也可以通过其它的方式实现。以上所描述的装置和方法实施例仅仅是示意性的,例如,附图中的流程图和框图显示了根据本申请的多个实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或代码的一部分,所述模块、程序段或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现方式中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
另外,在本申请各个实施例中的各功能模块可以集成在一起形成一个独立的部分,也可以是各个模块单独存在,也可以两个或两个以上模块集成形成一个独立的部分。
所述功能如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机、或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。

Claims (10)

1.一种基于人工智能的数据优化存储方法,其特征在于,应用于大数据系统,所述方法包括:
响应于针对软件检测数据的存储优化请求,获取拟进行存储优化处理的选定软件检测数据;
通过完成调试的检测报告语义挖掘网络,得到所述选定软件检测数据的软件缺陷-修复文本语义对,其中,所述完成调试的检测报告语义挖掘网络是结合多维度学习特征调试所得的,所述软件缺陷-修复文本语义对包括软件缺陷记录的语义特征和软件修复记录的语义特征,所述软件缺陷-修复文本语义对用于表征相关软件缺陷及其对应的修复行为的对应关系;
通过所述软件缺陷-修复文本语义对,确定所述选定软件检测数据的结构化存储决策观点;
其中,所述通过所述软件缺陷-修复文本语义对,确定所述选定软件检测数据的结构化存储决策观点,包括:将所述软件缺陷-修复文本语义对输入存储决策处理模型,获得所述存储决策处理模型输出的所述选定软件检测数据的结构化存储决策观点。
2.根据权利要求1所述的方法,其特征在于,所述完成调试的检测报告语义挖掘网络的调试步骤包括:
获取包括若干个已认证软件检测数据的软件检测学习数据集合,所述软件检测学习数据集合中包括各所述已认证软件检测数据的先验结构化存储建议观点;
将所述软件检测学习数据集合中的各所述已认证软件检测数据加载到待调试的深度结构化语义网络中,得到各所述已认证软件检测数据的软件缺陷-修复文本语义对;
针对每个设定存储优化决策观点,依据所述软件检测学习数据集合中属于该设定存储优化决策观点的已认证软件检测数据的软件缺陷-修复文本语义对,确定各设定存储优化决策观点的观点描述知识;
针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分;
通过各所述已认证软件检测数据的先验结构化存储建议观点、存储优化执行评分、软件缺陷-修复文本语义对以及各所述设定存储优化决策观点的观点描述知识,对所述待调试的深度结构化语义网络的网络变量进行改进,直到所述深度结构化语义网络的调试代价变量符合调试终止要求,抽取调试所得的深度结构化语义网络中的深度可逆残差组件作为检测报告语义挖掘网络。
3.根据权利要求2所述的方法,其特征在于,针对每个所述已认证软件检测数据,所述通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分,包括:
确定该已认证软件检测数据的软件缺陷-修复文本语义对与第一存储优化决策观点的观点描述知识之间的第一特征差异度量,所述第一存储优化决策观点为任一所述设定存储优化决策观点;
依据预设特征差异度量,更新所述第一特征差异度量;
确定所述第一特征差异度量更新之前,该已认证软件检测数据的软件缺陷-修复学习语义对与所述第一存储优化决策观点的观点描述知识之间的第一共性指数、以及所述第一特征差异度量更新之后,该已认证软件检测数据的软件缺陷-修复文本语义对与所述第一存储优化决策观点的观点描述知识之间的第二共性指数;
如果所述第一共性指数不大于所述第二共性指数,确定所述已认证软件检测数据的存储优化执行评分为第一执行评分,如果所述第一共性指数大于所述第二共性指数,确定所述已认证软件检测数据的存储优化执行评分为第二执行评分;
其中,所述第一共性指数为所述第一特征差异度量的目标值,所述第二共性指数为完成更新的第一特征差异度量的目标值。
4.根据权利要求2所述的方法,其特征在于,所述通过各所述已认证软件检测数据的先验结构化存储建议观点、存储优化执行评分、软件缺陷-修复文本语义对以及各所述设定存储优化决策观点的观点描述知识,对所述待调试的深度结构化语义网络的网络变量进行改进,包括:
针对每个所述已认证软件检测数据,通过该已认证软件检测数据的存储优化执行评分确定该已认证软件检测数据的结构化处理权重;
通过各已认证软件检测数据的先验结构化存储建议观点、结构化处理权重、软件缺陷-修复文本语义对以及所述各设定存储优化决策观点的观点描述知识,确定所述调试代价变量;
如果所述调试代价变量不符合调试终止要求,则依据所述调试代价变量,对所述待调试的深度结构化语义网络的网络变量进行改进。
5.根据权利要求4所述的方法,其特征在于,每个已认证软件检测数据的存储优化执行评分为第一执行评分或第二执行评分,所述通过该已认证软件检测数据的存储优化执行评分确定该已认证软件检测数据的结构化处理权重,包括:
如果该已认证软件检测数据的存储优化执行评分为第一执行评分,则将该已认证软件检测数据的结构化处理权重确定为预设权重;
如果该已认证软件检测数据的存储优化执行评分为第二执行评分,则通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重;其中,所述各待处理存储优化决策观点为各设定存储优化决策观点中除该已认证软件检测数据的先验结构化存储建议观点以外的存储优化决策观点。
6.根据权利要求5所述的方法,其特征在于,所述通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重,包括:
通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识,确定该已认证软件检测数据相对于各所述待处理存储优化决策观点的存储优化执行评分;
将对应的存储优化执行评分为第二执行评分的待处理存储优化决策观点作为第二存储优化决策观点;
通过该已认证软件检测数据的软件缺陷-修复文本语义对与各第二执行评分的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重;
其中,所述通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识,确定该已认证软件检测数据相对于各所述待处理存储优化决策观点的存储优化执行评分,包括:
针对每个所述待处理存储优化决策观点,确定该已认证软件检测数据的软件缺陷-修复文本语义对与该待处理存储优化决策观点的观点描述知识之间的第二特征差异度量;
依据预设特征差异度量,更新所述第二特征差异度量;
确定所述第二特征差异度量更新之前,该已认证软件检测数据的软件缺陷-修复学习语义对与该待处理存储优化决策观点的观点代表特征之间的第三共性指数、以及所述第二特征差异度量更新之后,该已认证软件检测数据的软件缺陷-修复学习语义对与该待处理存储优化决策观点的观点代表特征之间的第四共性指数;
如果所述第三共性指数大于所述第四共性指数,确定该已认证软件检测数据相对于该待处理存储优化决策观点的存储优化执行评分为第二执行评分。
7.根据权利要求5所述的方法,其特征在于,所述通过该已认证软件检测数据的软件缺陷-修复文本语义对与各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的结构化处理权重,包括:
通过该已认证软件检测数据的软件缺陷-修复文本语义对和各待处理存储优化决策观点的观点描述知识之间的共性指数,确定该已认证软件检测数据的权重修改因子;
依据所述权重修改因子对所述预设权重进行改进,得到该已认证软件检测数据的结构化处理权重,其中,所述结构化处理权重不小于所述预设权重;
其中,所述依据所述权重修改因子对预设权重进行改进,得到该已认证软件检测数据的结构化处理权重,包括:将所述权重修改因子与所述预设权重的和确定为该已认证软件检测数据的结构化处理权重。
8.根据权利要求2所述的方法,其特征在于,所述调试代价变量是基于交叉熵的调试代价变量,所述基于交叉熵的调试代价变量是通过如下步骤确定的:
将每个所述已认证软件检测数据的存储优化执行评分作为该已认证软件检测数据对应的交叉熵;
通过各所述已认证软件检测数据的先验结构化存储建议观点、交叉熵、软件缺陷-修复文本语义对以及所述各设定存储优化决策观点的观点描述知识,确定所述基于交叉熵的调试代价变量。
9.根据权利要求2所述的方法,其特征在于,所述深度结构化语义网络包括观点判别处理组件,所述深度可逆残差组件和所述观点判别处理组件相连,所述方法还包括:
针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对,通过所述观点判别处理组件确定该已认证软件检测数据在各所述设定存储优化决策观点中所属的存储优化预测观点;
基于每个所述已认证软件检测数据对应的存储优化预测观点,确定第一机器学习数据集和第二机器学习数据集,所述第一机器学习数据集包括所述软件检测学习数据集合中先验结构化存储建议观点与存储优化预测观点相同的已认证软件检测数据,所述第二机器学习数据集为所述软件检测学习数据集合中除第一机器学习数据集以外的已认证软件检测数据;
所述针对每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分,包括:
对于所述第二机器学习数据集中的每个所述已认证软件检测数据,通过该已认证软件检测数据的软件缺陷-修复文本语义对以及最少一个所述设定存储优化决策观点的观点描述知识,确定该已认证软件检测数据的存储优化执行评分。
10.一种大数据系统,其特征在于,包括处理器和存储器;所述处理器和所述存储器通信连接,所述处理器用于从所述存储器中读取计算机程序并执行,以实现权利要求1-9任一项所述的方法。
CN202310847276.2A 2023-07-12 2023-07-12 基于人工智能的数据优化存储方法及大数据系统 Active CN116578568B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310847276.2A CN116578568B (zh) 2023-07-12 2023-07-12 基于人工智能的数据优化存储方法及大数据系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310847276.2A CN116578568B (zh) 2023-07-12 2023-07-12 基于人工智能的数据优化存储方法及大数据系统

Publications (2)

Publication Number Publication Date
CN116578568A true CN116578568A (zh) 2023-08-11
CN116578568B CN116578568B (zh) 2023-09-15

Family

ID=87534425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310847276.2A Active CN116578568B (zh) 2023-07-12 2023-07-12 基于人工智能的数据优化存储方法及大数据系统

Country Status (1)

Country Link
CN (1) CN116578568B (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556449A (zh) * 2023-12-08 2024-02-13 广东德威检验认证有限公司 基于大数据的化学品检测报告数据加密方法
CN117951546A (zh) * 2024-03-26 2024-04-30 华仁建设集团有限公司 结合bim的混凝土结构缺陷检测方法及系统
CN117984024A (zh) * 2024-04-03 2024-05-07 中国水利水电第十工程局有限公司 基于船闸人字门自动化生产的焊接数据管理方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053965A (zh) * 2009-10-27 2011-05-11 上海杉达学院 软件测试的缺陷数据库
CN110597735A (zh) * 2019-09-25 2019-12-20 北京航空航天大学 一种面向开源软件缺陷特征深度学习的软件缺陷预测方法
CN113239365A (zh) * 2021-07-12 2021-08-10 深圳市永达电子信息股份有限公司 一种基于知识图谱的漏洞修复方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102053965A (zh) * 2009-10-27 2011-05-11 上海杉达学院 软件测试的缺陷数据库
CN110597735A (zh) * 2019-09-25 2019-12-20 北京航空航天大学 一种面向开源软件缺陷特征深度学习的软件缺陷预测方法
CN113239365A (zh) * 2021-07-12 2021-08-10 深圳市永达电子信息股份有限公司 一种基于知识图谱的漏洞修复方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117556449A (zh) * 2023-12-08 2024-02-13 广东德威检验认证有限公司 基于大数据的化学品检测报告数据加密方法
CN117556449B (zh) * 2023-12-08 2024-04-02 广东德威检验认证有限公司 基于大数据的化学品检测报告数据加密方法
CN117951546A (zh) * 2024-03-26 2024-04-30 华仁建设集团有限公司 结合bim的混凝土结构缺陷检测方法及系统
CN117951546B (zh) * 2024-03-26 2024-05-31 华仁建设集团有限公司 结合bim的混凝土结构缺陷检测方法及系统
CN117984024A (zh) * 2024-04-03 2024-05-07 中国水利水电第十工程局有限公司 基于船闸人字门自动化生产的焊接数据管理方法及系统

Also Published As

Publication number Publication date
CN116578568B (zh) 2023-09-15

Similar Documents

Publication Publication Date Title
CN116578568B (zh) 基于人工智能的数据优化存储方法及大数据系统
US11651014B2 (en) Source code retrieval
US10621493B2 (en) Multiple record linkage algorithm selector
US10769043B2 (en) System and method for assisting user to resolve a hardware issue and a software issue
CN109063433B (zh) 虚假用户的识别方法、装置及可读存储介质
CN113626241B (zh) 应用程序的异常处理方法、装置、设备及存储介质
CN109871891B (zh) 一种物体识别方法、装置和存储介质
CN111447574A (zh) 短信分类方法、装置、系统和存储介质
CN110334262B (zh) 一种模型训练方法、装置及电子设备
CN114861112A (zh) 基于数据存取和大数据分类的信息分发方法及系统
CN115982053A (zh) 一种检测软件源代码缺陷的方法、装置及应用
CN116107834A (zh) 日志异常检测方法、装置、设备及存储介质
CN116756298B (zh) 面向云数据库的ai会话信息优化方法及大数据优化服务器
CN113342799A (zh) 一种数据修正方法及系统
CN115221135B (zh) 一种工业互联网数据的共享方法及系统
CN111290953B (zh) 分析测试日志的方法与装置
CN117216051A (zh) 用于大语言模型训练的数据标注质量的确定方法、装置
CN116541528A (zh) 招聘领域知识图谱构建的打标签方法和系统
CN113987005A (zh) 应用于边缘计算的生产数据管理方法及云平台
US20200273351A1 (en) Methods and Systems for Data Parameter Reasonability Analysis
CN114374931A (zh) 基于近邻成分分析的度量学习的指纹定位方法
CN113627834B (zh) 一种果蔬全链条智能监测预警方法及系统
CN115658675B (zh) 应用于数据处理的噪声优化方法及ai系统
CN115802355B (zh) 一种移动物联网卡管理方法、装置及云平台
CN115718680B (zh) 数据读取方法、系统、计算机及可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant