CN110837459A - 一种基于大数据的运行绩效分析方法及系统 - Google Patents
一种基于大数据的运行绩效分析方法及系统 Download PDFInfo
- Publication number
- CN110837459A CN110837459A CN201911080351.7A CN201911080351A CN110837459A CN 110837459 A CN110837459 A CN 110837459A CN 201911080351 A CN201911080351 A CN 201911080351A CN 110837459 A CN110837459 A CN 110837459A
- Authority
- CN
- China
- Prior art keywords
- data
- cleaning
- operation data
- performance analysis
- mapping
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F11/00—Error detection; Error correction; Monitoring
- G06F11/30—Monitoring
- G06F11/34—Recording or statistical evaluation of computer activity, e.g. of down time, of input/output operation ; Recording or statistical evaluation of user activity, e.g. usability assessment
- G06F11/3466—Performance evaluation by tracing or monitoring
- G06F11/3495—Performance evaluation by tracing or monitoring for systems
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/21—Design, administration or maintenance of databases
- G06F16/215—Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Engineering & Computer Science (AREA)
- Quality & Reliability (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Databases & Information Systems (AREA)
- Computer Hardware Design (AREA)
- Data Mining & Analysis (AREA)
- Debugging And Monitoring (AREA)
Abstract
本发明公开了一种基于大数据的运行绩效分析方法,包括:获取目标系统的数据库日志文件并对日志文件进行数据提取,得到目标系统的运行数据;通过LLE流形学习算法对运行数据进行数据降维处理;对降维处理后的运行数据进行数据清洗,得到可用运行数据;根据参数类型对可用运行数据进行类别分类,将各个类别的可用运行数据分别储存在数据集中;对各个数据集中的可运行数据进行识别统计,得到运行绩效分析结果;本发明通过对系统运行数据进行数据降维处理和数据清洗处理,从而对系统海量大数据的高维复杂性进行降维处理并清洗错误数据碎片,进而实现提升分析处理效率并提高分析准确率,使得技术人员对系统进行正确的活跃度评价。
Description
技术领域
本发明涉及数据处理领域,尤其涉及一种基于大数据的运行绩效分析方法及系统。
背景技术
系统运行绩效是对一个系统进行评价活跃度的指标。在大数据风靡全球的环境下,对系统的运行绩效进行分析处理时,会因为海量大数据的复杂性对原有的系统运行绩效体系进行冲击,人们应用现有的评价服务平台对大数据系统进行运行绩效分析时,难以对海量大数据进行分析处理,降低了分析处理效率;由于数据复杂性而造成的错误数据碎片也会对系统的运行绩效分析产生影响,增大误差率;从而使得技术人员无法对系统进行正确的活跃度评价。
发明内容
本发明提供了一种基于大数据的运行绩效分析方法及系统,通过对系统运行数据进行数据降维处理和数据清洗处理,以解决应用现有的评价服务平台对大数据系统进行运行绩效分析时,难以对海量大数据进行分析处理的技术问题,从而对系统海量大数据的高维复杂性进行降维处理并清洗错误数据碎片,进而实现提升分析处理效率并提高分析准确率,使得技术人员对系统进行正确的活跃度评价。
为了解决上述技术问题,本发明实施例提供了一种基于大数据的运行绩效分析方法,包括:
获取目标系统的数据库日志文件并对所述日志文件进行数据提取,得到目标系统的运行数据;
通过LLE流形学习算法对所述运行数据进行数据降维处理;
对降维处理后的运行数据进行数据清洗,得到可用运行数据;
根据参数类型对所述可用运行数据进行类别分类,将各个类别的可用运行数据分别储存在数据集中;
对各个数据集中的可运行数据进行识别统计,得到运行绩效分析结果。
作为优选方案,所述通过LLE流形学习算法对所述运行数据进行数据降维处理,具体包括:
在运行数据中设置多个样本点数据,计算所述运行数据的每个样本点的近邻点;
根据所述每个样本点的近邻点计算该样本点的局部重建权值矩阵;
将所述局部重建权值矩阵的计算值作为映射常数并映射每个样本点到低维空间中进行数据重构。
作为优选方案,所述对降维处理后的运行数据进行数据清洗,得到可用运行数据,具体包括:
对降维处理后的运行数据进行预处理,得到预处理后的需清洗数据;
对所述需清洗数据进行Job划分,得到多个清洗Job,将每一个所述清洗Job映射到具体的业务需求,得到映射清洗数据;
根据预设的清洗规则,每个清洗Job按照所述数据清洗规则库的要求,对所述映射清洗数据采用树形清洗结构进行清洗,得到最终清洗结果。
作为优选方案,所述对降维处理后的运行数据进行预处理,得到预处理后的需清洗数据,具体包括:
根据数据格式化规则对降维处理后的运行数据进行格式化;
对格式化后的运行数据进行相似重复数据检测和清洗;
对格式化后的运行数据进行错误值检测和清洗。
作为优选方案,所述参数类型包括服务器运行时间、服务器每秒接收字节数、服务器每秒发送字节数、服务器每秒执行的语句数、服务器每秒事务数和服务器每秒查询率。
本发明实施例提供了一种基于大数据的运行绩效分析系统,包括:
数据获取模块,用于获取目标系统的数据库日志文件并对所述日志文件进行数据提取,得到目标系统的运行数据;
数据降维模块,用于通过LLE流形学习算法对所述运行数据进行数据降维处理;
数据清洗模块,用于对降维处理后的运行数据进行数据清洗,得到可用运行数据;
数据分类模块,用于根据参数类型对所述可用运行数据进行类别分类,将各个类别的可用运行数据分别储存在数据集中;
数据分析模块,用于对各个数据集中的可运行数据进行识别统计,得到运行绩效分析结果。
作为优选方案,所述数据降维模块包括:
数据样本单元,用于在运行数据中设置多个样本点数据,计算所述运行数据的每个样本点的近邻点;
样本计算单元,用于根据所述每个样本点的近邻点计算该样本点的局部重建权值矩阵;
数据重构单元,用于将所述局部重建权值矩阵的计算值作为映射常数并映射每个样本点到低维空间中进行数据重构。
作为优选方案,所述数据清洗模块包括:
预处理单元,用于对降维处理后的运行数据进行预处理,得到预处理后的需清洗数据;
数据映射单元,用于对所述需清洗数据进行Job划分,得到多个清洗Job,将每一个所述清洗Job映射到具体的业务需求,得到映射清洗数据;
数据清洗单元,用于根据预设的清洗规则,每个清洗Job按照所述数据清洗规则库的要求,对所述映射清洗数据采用树形清洗结构进行清洗,得到最终清洗结果;
所述预处理单元包括:
格式化子单元,用于根据数据格式化规则对降维处理后的运行数据进行格式化;
第一清洗子单元,用于对格式化后的运行数据进行相似重复数据检测和清洗;
第二清洗子单元,用于对格式化后的运行数据进行错误值检测和清洗。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如上述任一项所述的基于大数据的运行绩效分析方法。
本发明实施例还提供了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如上述任一项所述的基于大数据的运行绩效分析方法。
相比于现有技术,本发明实施例具有如下有益效果:
本发明通过对系统运行数据进行数据降维处理和数据清洗处理,以解决应用现有的评价服务平台对大数据系统进行运行绩效分析时,难以对海量大数据进行分析处理的技术问题,从而对系统海量大数据的高维复杂性进行降维处理并清洗错误数据碎片,进而实现提升分析处理效率并提高分析准确率,使得技术人员对系统进行正确的活跃度评价。
附图说明
图1:为本发明基于大数据的运行绩效分析方法的步骤流程图;
图2:为本发明基于大数据的运行绩效分析系统的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参照图1,本发明优选实施例提供了一种基于大数据的运行绩效分析方法,包括:
S1,获取目标系统的数据库日志文件并对所述日志文件进行数据提取,得到目标系统的运行数据。在目标系统数据库提供访问权限的情况下,收集数据库系统运行数据,评价数据库的使用情况,以数据库使用情况指标作为系统运行绩效评价的依据。
S2,通过LLE流形学习算法对所述运行数据进行数据降维处理。在本实施例中,所述步骤S2具体包括:
S21,在运行数据中设置多个样本点数据,计算所述运行数据的每个样本点的近邻点。通过随机抽取算法对运行数据进行样本点选取,将所述运行数据的样本进行集合到数据集,将任何一个样本点进行向量形式表达,N表示样本个数;采用最近邻策略,计算出该样本点的多个近邻点。
S22,根据所述每个样本点的近邻点计算该样本点的局部重建权值矩阵。预设定义重构误差值,并计算各样本与其邻近点之间的权值;通过方差矩阵算法定义局部协方差矩阵,计算该样本点的局部重建权值;最后分别计算出每一个样本点的局部重建权值。
S23,将所述局部重建权值矩阵的计算值作为映射常数并映射每个样本点到低维空间中进行数据重构。通过第三方低维空间软件建立低维空间,并将数据映射重建。应当说明的是,在本步骤中,采取样本点逐一映射的方式进行空间重构,但是也可以通过多样本点的方式进行统一映射重构,甚至是通过将所有样本点进行一次性的映射重构。在对所有样本点进行一次性的映射重构中,需要在构建的低维空间中设置多通道映射渠道。
S3,对降维处理后的运行数据进行数据清洗,得到可用运行数据。在本实施例中,所述步骤S3具体包括:
S31,对降维处理后的运行数据进行预处理,得到预处理后的需清洗数据;在本实施例中,所述步骤S31具体包括:S311,根据数据格式化规则对降维处理后的运行数据进行格式化;S312,对格式化后的运行数据进行相似重复数据检测和清洗;S313,对格式化后的运行数据进行错误值检测和清洗。
S32,对所述需清洗数据进行Job划分,得到多个清洗Job,将每一个所述清洗Job映射到具体的业务需求,得到映射清洗数据;
S33,根据预设的清洗规则,每个清洗Job按照所述数据清洗规则库的要求,对所述映射清洗数据采用树形清洗结构进行清洗,得到最终清洗结果。
S4,根据参数类型对所述可用运行数据进行类别分类,将各个类别的可用运行数据分别储存在数据集中;在本实施例中,所述参数类型包括服务器运行时间、服务器每秒接收字节数、服务器每秒发送字节数、服务器每秒执行的语句数、服务器每秒事务数和服务器每秒查询率等等。
具体地,服务器运行时间包括服务器已经运行的时间(以秒为单位);服务器每秒接收字节数包括一段时间内,目标数据库收到从客户端来的字节数;服务器每秒发送字节数包括一段时间内,目标数据库发送给客户端的字节数;服务器每秒执行的语句数包括一段时间内,CRUD语句执行的次数;服务器每秒事务数包括一段时间内,执行的事务数;服务器每秒查询率包括每秒查询率QPS,是对一个特定的查询服务器在规定时间内所处理流量多少的衡量标准。
S5,对各个数据集中的可运行数据进行识别统计,得到运行绩效分析结果。根据上述参数类别内容,我们可以对数据库每天执行的SQL语句条数、近7天数据库每天执行的SQL语句条数、近30天数据库每天执行的SQL语句条数、近N天数据库每天执行的SQL语句条数以及在日志的SQL中访问最多的数据库表进行统计,最后将统计结果数据进行图形化处理,得到数据分析图表。通过1该数据分析图表,我们可以直观地观察到该系统的运行数据情况,对系统的运行绩效进行正确的评价。
本发明通过对系统运行数据进行数据降维处理和数据清洗处理,以解决应用现有的评价服务平台对大数据系统进行运行绩效分析时,难以对海量大数据进行分析处理的技术问题,从而对系统海量大数据的高维复杂性进行降维处理并清洗错误数据碎片,进而实现提升分析处理效率并提高分析准确率,使得技术人员对系统进行正确的活跃度评价。
请参照图2,相应地,本发明实施例提供了一种基于大数据的运行绩效分析系统,包括:
数据获取模块,用于获取目标系统的数据库日志文件并对所述日志文件进行数据提取,得到目标系统的运行数据。
数据降维模块,用于通过LLE流形学习算法对所述运行数据进行数据降维处理;在本实施例中,所述数据降维模块包括:数据样本单元,用于在运行数据中设置多个样本点数据,计算所述运行数据的每个样本点的近邻点;样本计算单元,用于根据所述每个样本点的近邻点计算该样本点的局部重建权值矩阵;数据重构单元,用于将所述局部重建权值矩阵的计算值作为映射常数并映射每个样本点到低维空间中进行数据重构。
数据清洗模块,用于对降维处理后的运行数据进行数据清洗,得到可用运行数据;在本实施例中,所述数据清洗模块包括:预处理单元,用于对降维处理后的运行数据进行预处理,得到预处理后的需清洗数据;数据映射单元,用于对所述需清洗数据进行Job划分,得到多个清洗Job,将每一个所述清洗Job映射到具体的业务需求,得到映射清洗数据;数据清洗单元,用于根据预设的清洗规则,每个清洗Job按照所述数据清洗规则库的要求,对所述映射清洗数据采用树形清洗结构进行清洗,得到最终清洗结果;所述预处理单元包括:格式化子单元,用于根据数据格式化规则对降维处理后的运行数据进行格式化;第一清洗子单元,用于对格式化后的运行数据进行相似重复数据检测和清洗;第二清洗子单元,用于对格式化后的运行数据进行错误值检测和清洗。
数据分类模块,用于根据参数类型对所述可用运行数据进行类别分类,将各个类别的可用运行数据分别储存在数据集中。
数据分析模块,用于对各个数据集中的可运行数据进行识别统计,得到运行绩效分析结果。
本发明实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行上述任一实施例所述的基于大数据的运行绩效分析方法。
本发明实施例还提供了一种终端设备,所述终端设备包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现上述任一实施例所述的基于大数据的运行绩效分析方法。
优选地,所述计算机程序可以被分割成一个或多个模块/单元(如计算机程序、计算机程序),所述一个或者多个模块/单元被存储在所述存储器中,并由所述处理器执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序在所述终端设备中的执行过程。
所述处理器可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等,通用处理器可以是微处理器,或者所述处理器也可以是任何常规的处理器,所述处理器是所述终端设备的控制中心,利用各种接口和线路连接所述终端设备的各个部分。
所述存储器主要包括程序存储区和数据存储区,其中,程序存储区可存储操作系统、至少一个功能所需的应用程序等,数据存储区可存储相关数据等。此外,所述存储器可以是高速随机存取存储器,还可以是非易失性存储器,例如插接式硬盘,智能存储卡(SmartMedia Card,SMC)、安全数字(Secure Digital,SD)卡和闪存卡(Flash Card)等,或所述存储器也可以是其他易失性固态存储器件。
需要说明的是,上述终端设备可包括,但不仅限于,处理器、存储器,本领域技术人员可以理解,上述终端设备仅仅是示例,并不构成对终端设备的限定,可以包括更多或更少的部件,或者组合某些部件,或者不同的部件。
以上所述的具体实施例,对本发明的目的、技术方案和有益效果进行了进一步的详细说明,应当理解,以上所述仅为本发明的具体实施例而已,并不用于限定本发明的保护范围。特别指出,对于本领域技术人员来说,凡在本发明的精神和原则之内,所做的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种基于大数据的运行绩效分析方法,其特征在于,包括:
获取目标系统的数据库日志文件并对所述日志文件进行数据提取,得到目标系统的运行数据;
通过LLE流形学习算法对所述运行数据进行数据降维处理;
对降维处理后的运行数据进行数据清洗,得到可用运行数据;
根据参数类型对所述可用运行数据进行类别分类,将各个类别的可用运行数据分别储存在数据集中;
对各个数据集中的可运行数据进行识别统计,得到运行绩效分析结果。
2.如权利要求1所述的基于大数据的运行绩效分析方法,其特征在于,所述通过LLE流形学习算法对所述运行数据进行数据降维处理,具体包括:
在运行数据中设置多个样本点数据,计算所述运行数据的每个样本点的近邻点;
根据所述每个样本点的近邻点计算该样本点的局部重建权值矩阵;
将所述局部重建权值矩阵的计算值作为映射常数并映射每个样本点到低维空间中进行数据重构。
3.如权利要求1所述的基于大数据的运行绩效分析方法,其特征在于,所述对降维处理后的运行数据进行数据清洗,得到可用运行数据,具体包括:
对降维处理后的运行数据进行预处理,得到预处理后的需清洗数据;
对所述需清洗数据进行Job划分,得到多个清洗Job,将每一个所述清洗Job映射到具体的业务需求,得到映射清洗数据;
根据预设的清洗规则,每个清洗Job按照所述数据清洗规则库的要求,对所述映射清洗数据采用树形清洗结构进行清洗,得到最终清洗结果。
4.如权利要求3所述的基于大数据的运行绩效分析方法,其特征在于,所述对降维处理后的运行数据进行预处理,得到预处理后的需清洗数据,具体包括:
根据数据格式化规则对降维处理后的运行数据进行格式化;
对格式化后的运行数据进行相似重复数据检测和清洗;
对格式化后的运行数据进行错误值检测和清洗。
5.如权利要求1所述的基于大数据的运行绩效分析方法,其特征在于,所述参数类型包括服务器运行时间、服务器每秒接收字节数、服务器每秒发送字节数、服务器每秒执行的语句数、服务器每秒事务数和服务器每秒查询率。
6.一种基于大数据的运行绩效分析系统,其特征在于,包括:
数据获取模块,用于获取目标系统的数据库日志文件并对所述日志文件进行数据提取,得到目标系统的运行数据;
数据降维模块,用于通过LLE流形学习算法对所述运行数据进行数据降维处理;
数据清洗模块,用于对降维处理后的运行数据进行数据清洗,得到可用运行数据;
数据分类模块,用于根据参数类型对所述可用运行数据进行类别分类,将各个类别的可用运行数据分别储存在数据集中;
数据分析模块,用于对各个数据集中的可运行数据进行识别统计,得到运行绩效分析结果。
7.如权利要求6所述的基于大数据的运行绩效分析系统,其特征在于,所述数据降维模块包括:
数据样本单元,用于在运行数据中设置多个样本点数据,计算所述运行数据的每个样本点的近邻点;
样本计算单元,用于根据所述每个样本点的近邻点计算该样本点的局部重建权值矩阵;
数据重构单元,用于将所述局部重建权值矩阵的计算值作为映射常数并映射每个样本点到低维空间中进行数据重构。
8.如权利要求6所述的基于大数据的运行绩效分析系统,其特征在于,所述数据清洗模块包括:
预处理单元,用于对降维处理后的运行数据进行预处理,得到预处理后的需清洗数据;
数据映射单元,用于对所述需清洗数据进行Job划分,得到多个清洗Job,将每一个所述清洗Job映射到具体的业务需求,得到映射清洗数据;
数据清洗单元,用于根据预设的清洗规则,每个清洗Job按照所述数据清洗规则库的要求,对所述映射清洗数据采用树形清洗结构进行清洗,得到最终清洗结果;
所述预处理单元包括:
格式化子单元,用于根据数据格式化规则对降维处理后的运行数据进行格式化;
第一清洗子单元,用于对格式化后的运行数据进行相似重复数据检测和清洗;
第二清洗子单元,用于对格式化后的运行数据进行错误值检测和清洗。
9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序;其中,所述计算机程序在运行时控制所述计算机可读存储介质所在的设备执行如权利要求1~5任一项所述的基于大数据的运行绩效分析方法。
10.一种终端设备,其特征在于,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器在执行所述计算机程序时实现如权利要求1~5任一项所述的基于大数据的运行绩效分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911080351.7A CN110837459A (zh) | 2019-11-07 | 2019-11-07 | 一种基于大数据的运行绩效分析方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201911080351.7A CN110837459A (zh) | 2019-11-07 | 2019-11-07 | 一种基于大数据的运行绩效分析方法及系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN110837459A true CN110837459A (zh) | 2020-02-25 |
Family
ID=69576188
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201911080351.7A Pending CN110837459A (zh) | 2019-11-07 | 2019-11-07 | 一种基于大数据的运行绩效分析方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN110837459A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182081A (zh) * | 2020-09-23 | 2021-01-05 | 金现代信息产业股份有限公司 | 通勤客运车辆绩效分析方法和系统 |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106547862A (zh) * | 2016-10-31 | 2017-03-29 | 中原智慧城市设计研究院有限公司 | 基于流形学习的交通大数据降维处理方法 |
CN109753496A (zh) * | 2018-11-27 | 2019-05-14 | 天聚地合(苏州)数据股份有限公司 | 一种用于大数据的数据清洗方法 |
CN109962792A (zh) * | 2017-12-22 | 2019-07-02 | 南京欣网互联网络科技有限公司 | 一种基于大数据的全链路监控系统 |
CN110019078A (zh) * | 2019-02-25 | 2019-07-16 | 贵州格物数据有限公司 | 一种基于大数据的dns日志分析辅助决策系统及方法 |
-
2019
- 2019-11-07 CN CN201911080351.7A patent/CN110837459A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106547862A (zh) * | 2016-10-31 | 2017-03-29 | 中原智慧城市设计研究院有限公司 | 基于流形学习的交通大数据降维处理方法 |
CN109962792A (zh) * | 2017-12-22 | 2019-07-02 | 南京欣网互联网络科技有限公司 | 一种基于大数据的全链路监控系统 |
CN109753496A (zh) * | 2018-11-27 | 2019-05-14 | 天聚地合(苏州)数据股份有限公司 | 一种用于大数据的数据清洗方法 |
CN110019078A (zh) * | 2019-02-25 | 2019-07-16 | 贵州格物数据有限公司 | 一种基于大数据的dns日志分析辅助决策系统及方法 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN112182081A (zh) * | 2020-09-23 | 2021-01-05 | 金现代信息产业股份有限公司 | 通勤客运车辆绩效分析方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108446210B (zh) | 系统性能的度量方法、存储介质和服务器 | |
WO2019218699A1 (zh) | 欺诈交易判断方法、装置、计算机设备和存储介质 | |
US20140006044A1 (en) | System and method for preparing healthcare service bundles | |
CN108664538B (zh) | 一种输变电设备疑似家族性缺陷的自动辨识方法及系统 | |
CN114742477B (zh) | 企业订单数据处理方法、装置、设备及存储介质 | |
CN113822366A (zh) | 业务指标异常检测方法及装置、电子设备、存储介质 | |
CN110729054B (zh) | 异常就诊行为检测方法、装置、计算机设备及存储介质 | |
CN106257438B (zh) | 用于为单变量时间序列信号实时检测离群值的系统和方法 | |
CN111242318B (zh) | 基于异构特征库的业务模型训练方法及装置 | |
CN107818824A (zh) | 一种用于健康评估的健康模型构建方法及终端 | |
CN114186760A (zh) | 一种企业稳健运营的分析方法、系统及可读存储介质 | |
CN111210356B (zh) | 医保数据分析方法、装置、计算机设备和存储介质 | |
CN107480426B (zh) | 自迭代病历档案聚类分析系统 | |
CN113553341A (zh) | 多维数据分析方法、装置、设备及计算机可读存储介质 | |
CN114510487A (zh) | 数据表合并方法、装置、设备及存储介质 | |
CN116610821B (zh) | 一种基于知识图谱的企业风险分析方法、系统和存储介质 | |
CN110837459A (zh) | 一种基于大数据的运行绩效分析方法及系统 | |
CN103605746A (zh) | 获取访客质量的方法、装置及系统 | |
CN112529172B (zh) | 数据处理方法和数据处理设备 | |
CN110415779B (zh) | 保温措施有效性检测方法、装置、设备及存储介质 | |
CN113349792B (zh) | 基于多导联心电信号的分类方法、装置、设备及介质 | |
CN111091194A (zh) | 一种基于cavwnb_kl算法的操作系统识别方法 | |
CN113283677B (zh) | 指标数据处理方法、装置、设备及存储介质 | |
CN111581199B (zh) | 一种智能数据分析系统及方法 | |
CN115169705A (zh) | 配送时长预测方法、装置、存储介质及计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |