CN112286933B - 数据处理系统 - Google Patents

数据处理系统 Download PDF

Info

Publication number
CN112286933B
CN112286933B CN202011169507.1A CN202011169507A CN112286933B CN 112286933 B CN112286933 B CN 112286933B CN 202011169507 A CN202011169507 A CN 202011169507A CN 112286933 B CN112286933 B CN 112286933B
Authority
CN
China
Prior art keywords
data
component
attribute information
sampling
weight
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011169507.1A
Other languages
English (en)
Other versions
CN112286933A (zh
Inventor
安嘉晨
梁丹璐
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Chengdu xichip Financial Technology Co.,Ltd.
Original Assignee
Fofinvesting Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fofinvesting Technology Beijing Co ltd filed Critical Fofinvesting Technology Beijing Co ltd
Priority to CN202011169507.1A priority Critical patent/CN112286933B/zh
Publication of CN112286933A publication Critical patent/CN112286933A/zh
Application granted granted Critical
Publication of CN112286933B publication Critical patent/CN112286933B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • G06F16/2282Tablespace storage structures; Management thereof
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2455Query execution
    • G06F16/24553Query execution of query operations

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Databases & Information Systems (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computational Linguistics (AREA)
  • Software Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明涉及一种数据处理系统,包括数据库,处理器和存储有计算机程序的存储器,所述数据库包括第一数据表和第二数据表,所述第一数据表的每条记录均为周期结果数据,所述周期结果数据为采样数据,所述第一数据表的字段包括结果数据ID、X个时间‑采样值对、周期标识、M个数据索引,其中,X为采样周期内固定的采样次数;所述第二数据表的字段包括随机数据标识、随机数据采样时间和随机数据采样值。本发明能够对结果数据以及结果数据的不同的数据分量可能具有不同的属性,且同一分量可能具有多种属性的数据处理场景,准确快速地获取到周期结果数据对应的每个数据分量的权重。

Description

数据处理系统
技术领域
本发明涉及数据处理技术领域,尤其涉及一种数据处理系统。
背景技术
数据处理领域是计算机领域的重要分支。在计算机领域中,根据呈现方式,数据可以包括文本数据、图像数据、音频数据、视频数据等多种;根据存储方式,数据可以被存储到数据库、文本文件、特定格式文件(例如.doc/.xls)等;根据数据形成的方式,可以包括静态数据和动态数据,动态数据尤其是随时间变化的数据,例如通过温度传感器获取的温度数据、通过路由器交换机等网络设备获取的网络流量数据、通过GPS或北斗等采集的设备LBS数据等。数据处理可以为“正向处理”,例如利用某种算法处理图像,使之更清晰,也可以为“逆向处理”,例如在已知合成图像的清楚下,通过计算机程序分离合成图像所使用的多个原始图像。
静态数据的“逆向处理”相对容易。动态数据之间也会存在关联关系,但因为动态数据多是随时间变化的数据(尤其是随时间高频变化的数据),需要考虑时间维度对关联关系的影响,不仅会占用较多的计算机存储资源、检索资源、运算处理资源,而且处理精度也不够理想,因此如何高效的通过数据的“逆向处理”,获取动态数据的关联关系,成为数据处理的难点。动态的结果数据通常对应多个分量数据,现有技术通常采用基于多个数据分量以及对应的结果数据的数据集,进行线性回归,得到每个数据分量的权重的方式,来获取数据分量的关联关系。但是,有些分量数据可以直接获取,有些则无法直接获取,这种情况下,则无法直接采用线性回归来获取动态数据的关联关系。此外,由于不同的数据分量可能具有不同的属性,且同一分量可能具有多种属性,因此,直接进行线性回归获取数据分量的关联关系的准确度较低。
发明内容
本发明目的在于,提供一种数据处理系统,能够对结果数据以及结果数据的不同的数据分量可能具有不同的属性,且同一分量可能具有多种属性的数据处理场景,准确、快速地获取到周期结果数据对应的每个数据分量的权重。
本发明提供了一种数据处理系统,包括数据库,处理器和存储有计算机程序的存储器,所述数据库包括第一数据表和第二数据表,所述第一数据表的每条记录均为周期结果数据,所述周期结果数据为采样数据,所述第一数据表的字段包括结果数据ID、X个时间-采样值对、周期标识、M个数据索引,其中,X为采样周期内固定的采样次数;所述第二数据表的字段包括随机数据标识、随机数据采样时间和随机数据采样值;当所述计算机程序被处理器执行时,实现以下步骤:
步骤S1、接收用户输入的第n-m周期到n周期;
步骤S2、根据第i周期在所述第一数据表的周期标识中进行检索,获取对应的X个时间-采样值对中的采样值,以及M个数据索引,i=n-m,n-m+1…n;
步骤S3、根据X个时间-采样值对中的采样值获取第i周期的周期结果数据;
步骤S4、根据第i周期在所述第二数据表的随机数据采样时间中进行检索,根据M个数据索引在所述第二数据表的随机数据标识中进行检索,获取M组随机数据采样值;
步骤S5、根据M组随机数据采样值获取M个所述数据分量,所述M个数据分量信息M1个具有第一属性的第一数据分量,M2个具有第二属性的第二数据分量,M3个具有第三属性的第三数据分量,M4个同时具有第一属性和第二属性的第四数据分量,所述第四数据分量包括第一属性信息和第二属性信息,其中n、m、M、M1、M2、M3、M4均为正整数,n大于等于m,M=M1+M2+M3+M4;
步骤S6、以所述M1个第一数据分量、M3个第三数据分量作为自变量,对应的周期结果数据作为因变量构建第一线性回归模型进行训练,获取每一第一数据分量和每一第三数据分量对应的权重和第一残差项;
步骤S7、以所述M2个第二数据分量、M4个第四数据分量的第二属性信息作为自变量,以对应的所述第一残差项作为因变量构建第二线性回归模型进训练,获取每一第二数据分量对应的权重以及每一第四数据分量对应的第一权重分量;
步骤S8、以所述M4个第四数据分量的第一属性信息、M1个去除所述第四数据分量的第一属性信息后的第一数据分量作为自变量,以对应的周期结果数据作为因变量构建第三线性回归模型进行训练,获取每一第四数据分量的第二权重分量;
步骤S9、基于每一第四数据分量的第一权重分量和第二权重分量确定每一第四数据分量的权重。
本发明与现有技术相比具有明显的优点和有益效果。借由上述技术方案,本发明提供的一种数据处理系统可达到相当的技术进步性及实用性,并具有产业上的广泛利用价值,其至少具有下列优点:
本发明能够对结果数据以及结果数据的不同的数据分量可能具有不同的属性,且同一分量可能具有多种属性的数据处理场景,通过多层建模,准确快速地获取到每一数据分量对应结果数据的权重。此外,对于无法直接获取的分量数据,本发明通过该数据分量预先配置的中间分量来表征,从而准确、快度地获取到该数据分量对应的权重。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
图1为本发明实施例一提供的数据处理系统示意图;
图2为本发明实施例二提供的数据处理系统示意图;
图3为本发明实施例三提供的数据处理系统示意图。
具体实施方式
为更进一步阐述本发明为达成预定发明目的所采取的技术手段及功效,以下结合附图及较佳实施例,对依据本发明提出的一种数据处理系统的具体实施方式及其功效,详细说明如后。
实施例一、
本发明实施例提供了一种数据处理系统,如图1所示,包括数据库,处理器和存储有计算机程序的存储器,所述数据库包括第一数据表(table)和第二数据表,所述第一数据表的每条记录均为周期结果数据,所述周期结果数据为采样数据,所述第一数据表的字段(field)包括结果数据ID、X个时间-采样值对、周期标识、M个数据索引,其中,X为采样周期内固定的采样次数,周期标识根据X个时间-采样值对中最早的时间和最晚时间构成的时间范围确定;所述第二数据表的字段包括随机数据标识、随机数据采样时间和随机数据采样值;当所述计算机程序被处理器执行时,实现以下步骤:
步骤S1、接收用户输入的第n-m周期到n周期;
步骤S2、根据第i周期在所述第一数据表的周期标识中进行检索,获取对应的X个时间-采样值对中的采样值,以及M个数据索引,i=n-m,n-m+1…n;
步骤S3、根据X个时间-采样值对中的采样值获取第i周期的周期结果数据;
其中,所述周期结果数据可以是X个时间-采样值的均值、中位数、最大值、最小值、最后时间采样值、最初时间采样值等,其中均值可为加权平均值,优选的,所述周期结果数据是X个时间-采样值的加权平均值。
步骤S4、根据第i周期在所述第二数据表的随机数据采样时间中进行检索,根据M个数据索引在所述第二数据表的随机数据标识中进行检索,获取M组随机数据采样值;
步骤S5、根据M组随机数据采样值获取M个所述数据分量,所述M个数据分量信息M1个具有第一属性的第一数据分量,M2个具有第二属性的第二数据分量,M3个具有第三属性的第三数据分量,M4个同时具有第一属性和第二属性的第四数据分量,所述第四数据分量包括第一属性信息和第二属性信息,其中n、m、M、M1、M2、M3、M4均为正整数,n大于等于m,M=M1+M2+M3+M4;
其中,每组数据分量信息均可以是对应的随机数据采样值的均值、中位数、最大值、最小值、最后时间采样值、最初时间采样值等,其中均值可为加权平均值,优选的,每组数据分量信息是对应的随机数据采样值的加权平均值。所述数据分量可为日频波动在预设波动范围内的数据,例如日频波动范围在±10%以内的数据。
作为一种实施例,所述步骤S5中,第四数据分量对应的随机数据采样值包括第四数据分量采样值和对应的第一属性信息的采样值,所述步骤S5还包括:
步骤S51、根据第四数据分量采样值获取第四数据分量信息,根据第四数据分量对应的第一属性信息的采样值获取第四数据分量的第一属性信息;
步骤S52、以所述第四数据分量的第一属性信息作为自变量,以第四数据分量信息作为因变量构建进行线性回归,得到第二残差项,将所述第二残差项作为所述第四数据分量的第二属性信息。
步骤S6、以所述M1个第一数据分量、M3个第三数据分量作为自变量,对应的周期结果数据作为因变量构建第一线性回归模型进行训练,获取每一第一数据分量和每一第三数据分量对应的权重和第一残差项;
可以理解的是,本实施例中,基于多组自变量和因变量组成的训练集对回归模型进行训练,得到的回归模型表达式中,自变量对应的系数即为该自变量对应的权重,在本实施例中即为该数据分量对于结果数据的权重。
步骤S7、以所述M2个第二数据分量、M4个第四数据分量的第二属性信息作为自变量,以对应的所述第一残差项作为因变量构建第二线性回归模型进训练,获取每一第二数据分量对应的权重以及每一第四数据分量对应的第一权重分量;
步骤S8、以所述M4个第四数据分量的第一属性信息、M1个去除所述第四数据分量的第一属性信息后的第一数据分量作为自变量,以对应的周期结果数据作为因变量构建第三线性回归模型进行训练,获取每一第四数据分量的第二权重分量;
其中,作为一种示例,所述步骤S8还包括:
步骤S81、以第四数据分量的第一属性信息作为自变量,以第一数据分量作为因变量进行线性回归,得到第三残差项,将所述第三残差项作为去除第四数据分量的第一属性信息后的第一数据分量。
步骤S9、基于每一第四数据分量的第一权重分量和第二权重分量确定每一第四数据分量的权重。
其中,作为一种示例,所述步骤S9还包括:
步骤S91、以第四数据分量的第一属性信息和第一属性信息作为自变量,以第四数据分量作为因变量进行线性回归,获取到第一属性信息的权重值和第二属性信息的权重值;
步骤S92、根据第一属性信息的权重值和第二属性信息的权重值,以及第一权重分量和第二权重分量确定第四数据分量的权重。
例如,第四数据分量的第一权重分量A1,第二权重分量为A2,第一属性信息的权重值为a1,第二属性信息的权重值为a2,则第四数据分量的权重B=a1×A1+a2×A2。
本发明实施例一能够对结果数据以及结果数据的不同的数据分量可能具有不同的属性,且同一分量可能具有多种属性的数据处理场景,通过多层建模,准确快速地获取到每一数据分量对应结果数据的权重。
实施例二、
有些数据分量可以直接从第二数据表中获取,但是有些则无法直接从第二数据表中获取,本实施例中,可以采用多个中间分量来表征该数据分量,针对这类数据分量的获取,本发明实施例还提供了一种数据处理系统,如图2所示,包括数据库,处理器和存储有计算机程序的存储器,所述数据库包括第一数据表和数据配置表,所述第一数据表的每条记录均为周期结果数据,所述周期结果数据为采样数据,所述第一数据表的字段包括结果数据ID、X个时间-采样值对、周期标识、M个数据索引,其中,X为采样周期内固定的采样次数;所述数据配置表的字段包括随机数据标识、随机数据采样时间和随机数据标识对应的多个中间分量随机数据采样值;
当所述计算机程序被处理器执行时,实现以下步骤:
步骤S10、接收用户输入的第n-m周期到n周期;
步骤S20、根据第i周期在所述第一数据表的周期标识中进行检索,获取对应的X个时间-采样值对中的采样值,以及N个数据索引,i=n-m,n-m+1…n,其中,n、m、N均为正整数,n大于等于m,;
步骤S30、根据X个时间-采样值对中的采样值获取第i周期的周期结果数据;
其中,所述周期结果数据可以是X个时间-采样值的均值、中位数、最大值、最小值、最后时间采样值、最初时间采样值等,其中均值可为加权平均值,优选的,所述周期结果数据是X个时间-采样值的加权平均值。
步骤S40、根据第i周期在所述数据配置表的随机数据采样时间中进行检索,根据N个数据索引在所述数据配置表的随机数据标识中进行检索,获取N组中间分量随机数据采样值,每组包括多个中间分量随机数据采样值,用于表征该组中间分量对应的数据分量;
其中,每个中间分量信息均为对应的中间分量随机数据采样值的均值、中位数、最大值、最小值、最后时间采样值或最初时间采样值。其中均值可为加权平均值,优选的,每组数据分量信息是对应的随机数据采样值的加权平均值。所述数据分量可为日频波动在预设波动范围内的数据,例如日频波动范围在±10%以内的数据。
步骤S50、根据N组中间分量随机数据采样值获取N个所述数据分量信息对应的每一中间分量信息,每个中间分量随机数据采样值确定一个中间分量信息;
步骤S60、以N个所述数据分量信息对应的所有中间分量信息作为自变量,以对应的周期结果数据作为因变量构建线性回归方程,获取每个中间分量信息对应的边际拟合优度R;
作为一种实施例,所述步骤S60包括:
步骤S601、逐一获取每一所述中间分量信息与周期结果数据的第一相关性,确定第一相关性绝对值最大的中间分量信息F1,基于所述周期结果数据对所述F1进行回归运算,得到拟合优度R1,以及第一残差序列Y1,将F1对应的边际拟合优度确定为R1;
步骤S602、逐一获取除F1以外的其他所有中间分量信息与Y1的第二相关性,确定第二相关性绝对值最大的中间分量信息F2,基于所述周期结果数据对F1和F2进行回归运算,得到拟合优度R2,以及第二残差序列Y2,将F2对应的边际拟合优度确定为R2-R1;
步骤S603、逐一获取除F1和F2以外的其他所有中间分量信息与Y2的第三相关性,确定第三相关性绝对值最大的中间分量信息F3,基于所述周期结果数据对F1、F2和F3进行回归运算,得到拟合优度R3,以及第二残差序列Y3,将F3对应的边际拟合优度确定为R3-R2;
步骤S604、依此规律循环执行上述过程,直至得到所有中间分量信息对应的边际拟合优度。
步骤S70、获取每一数据分量信息对应的所有的中间分量的边际拟合优度之和MR;
步骤S80、基于所有MR确定每一数据分量的权重。
作为一种实施例,所述数据分量信息包括2个,分别为第一数据子分量信息和第二数据子分量信息,对应的所有的中间分量的边际拟合优度之分别为MR1和MR2,所述步骤S80包括:
步骤S81、构建中间回归模型:Y=aX1+bX20
步骤S82、对比MR1和MR2,若MR1>MR2,则a表示第一数据子变量信息的权重,b表示第一数据子变量信息的权重,ε0表示回归模型的残差项,则
Figure BDA0002746846910000081
Figure BDA0002746846910000091
求解得到:
Figure BDA0002746846910000092
Figure BDA0002746846910000093
作为一种实施例,所述系统还包括信息交互界面,用于接收用户输入的数据配置指令,并根据用户输入的数据配置指令配置所述数据配置表,所述数据配指令中包括中间分量id和对应的具体数值,可以理解的是,根据中间分量id可以确定该中间对应的具体数值在数据配置表中存储的位置。
本发明实施例二对无法直接获取的分量数据,该数据分量预先配置的中间分量来表征,从而准确、快度地获取到该数据分量对应的权重。
实施例三、
实施例一描述了数据分量全部可以从第二数据表中获取的数据处理系统,实施例二描述了一种数据分量全部不可以从第二数据表中获取,而需要从数据配置表中获取对应的中间分量来表征的数据处理系统。但还有一部分数据分量可以从第二数据表中获取,另一部分不能直接从第二数据表中获取,而需要从数据配置表来获取的数据处理场景,可以理解的是,针对这种数据处理场景,可以将实施例一和实施例二结合起来,以实施例一为基础,为了便于说明,本实施例中假设M2第二数据分量无法直接从第二数据表中获取,其他的数据分量以直接从第二数据表中获取。
结合后的数据处理系统如图3所示,包括:第一数据表、第二数据表和数据配置表,所述第一数据表的每条记录均为周期结果数据,所述周期结果数据为采样数据,所述第一数据表的字段包括结果数据ID、X个时间-采样值对、周期标识、M个数据索引,其中,X为采样周期内固定的采样次数;所述第二数据表的字段包括随机数据标识、随机数据采样时间和随机数据采样值;所述数据配置表的字段包括随机数据标识、随机数据采样时间和随机数据标识对应的多个中间分量随机数据采样值;;当所述计算机程序被处理器执行时,实现以下步骤:
步骤S100、接收用户输入的第n-m周期到n周期;
步骤S200、根据第i周期在所述第一数据表的周期标识中进行检索,获取对应的X个时间-采样值对中的采样值,以及M个数据索引,i=n-m,n-m+1…n;
步骤S300、根据X个时间-采样值对中的采样值获取第i周期的周期结果数据;
步骤S400、判断数据索引是否存在于第二数据表中,若存在则执行步骤S500,否则,执行步骤S600;
步骤S500、根据第i周期在所述第二数据表的随机数据采样时间中进行检索,根据数据索引在所述第二数据表的随机数据标识中进行检索,获取数据索引对应的随机数据采样值,然后执行步骤S700;
本实施例中,由于假设是M2第二数据分量无法直接从第二数据表中获取,因此,步骤S500一共获取M-M2组随机数据采样值;
步骤S600、根据第i周期在所述数据配置表的随机数据采样时间中进行检索,根据M2个数据索引在所述数据配置表的随机数据标识中进行检索,获取M2组中间分量随机数据采样值,每组至少包括两个中间分量随机数据采样值,然后执行步骤S700;
步骤S700、根据M-M2组随机数据采样值获取M-M2个所述数据分量,分别为M1个具有第一属性的第一数据分量,M3个具有第三属性的第三数据分量,M4个同时具有第一属性和第二属性的第四数据分量,所述第四数据分量包括第一属性信息和第二属性信息;其中,通过实施例一种的步骤S51-步骤S52获取第四数据分量的第一属性信息和第二属性信息,在此不再赘述。
根据M2组中间分量随机数据采样值获取M2个所述数据分量信息对应的每一中间分量信息,每个中间分量随机数据采样值确定一个中间分量信息,得到每个第二数据分量对应的所有中间分量。
步骤S800、以所述M1个第一数据分量、M3个第三数据分量作为自变量,对应的周期结果数据作为因变量构建第一线性回归模型进行训练,获取每一第一数据分量和每一第三数据分量对应的权重和第一残差项;
步骤S900、以所述M2个第二数据分量对应的所有的中间分量、M4个第四数据分量的第二属性信息作为自变量,以对应的所述第一残差项作为因变量构建第二线性回归模型进训练,获取每一第二数据分量的每一中间变量的边际拟合优度,以及每一第四数据分量对应的第一权重分量;具体通过实施例二步骤S601-步骤S604中的逻辑获取每一第二数据分量的每一中间变量的边际拟合优度,然后通过实施例二中的步骤S70、S80、步骤S81-步骤S82的逻辑能够获取每一第二数据分量的权重,在此不再赘述;
步骤S1000、以所述M4个第四数据分量的第一属性信息、M1个去除所述第四数据分量的第一属性信息后的第一数据分量作为自变量,以对应的周期结果数据作为因变量构建第三线性回归模型进行训练,获取每一第四数据分量的第二权重分量;
步骤S1100、基于每一第四数据分量的第一权重分量和第二权重分量确定每一第四数据分量的权重。
其中,具体通过实施例一中的S81、步骤S91-步骤S92获取每一第四数据分量的权重,在此不再赘述。
本发明实施例三能够对结果数据以及结果数据的不同的数据分量可能具有不同的属性,且同一分量可能具有多种属性的数据处理场景,通过多层建模,准确快速地获取到每一数据分量对应结果数据的权重。此外,对于无法直接获取的分量数据,还能够通过该数据分量预先配置的中间分量来表征,从而准确、快度地获取到该数据分量对应的权重。
以上所述,仅是本发明的较佳实施例而已,并非对本发明作任何形式上的限制,虽然本发明已以较佳实施例揭露如上,然而并非用以限定本发明,任何熟悉本专业的技术人员,在不脱离本发明技术方案范围内,当可利用上述揭示的技术内容作出些许更动或修饰为等同变化的等效实施例,但凡是未脱离本发明技术方案的内容,依据本发明的技术实质对以上实施例所作的任何简单修改、等同变化与修饰,均仍属于本发明技术方案的范围内。

Claims (8)

1.一种数据处理系统,其特征在于:
包括数据库,处理器和存储有计算机程序的存储器,所述数据库包括第一数据表和第二数据表,所述第一数据表的每条记录均为周期结果数据,所述周期结果数据为采样数据,所述第一数据表的字段包括结果数据ID、X个时间-采样值对、周期标识、M个数据索引,其中,X为采样周期内固定的采样次数;所述第二数据表的字段包括随机数据标识、随机数据采样时间和随机数据采样值;
当所述计算机程序被处理器执行时,实现以下步骤:
步骤S1、接收用户输入的第n-m周期到n周期;
步骤S2、根据第i周期在所述第一数据表的周期标识中进行检索,获取对应的X个时间-采样值对中的采样值,以及M个数据索引,i=n-m,n-m+1…n;
步骤S3、根据X个时间-采样值对中的采样值获取第i周期的周期结果数据;
步骤S4、根据第i周期在所述第二数据表的随机数据采样时间中进行检索,根据M个数据索引在所述第二数据表的随机数据标识中进行检索,获取M组随机数据采样值;
步骤S5、根据M组随机数据采样值获取M个数据分量,所述M个数据分量包括M1个具有第一属性的第一数据分量,M2个具有第二属性的第二数据分量,M3个具有第三属性的第三数据分量,M4个同时具有第一属性和第二属性的第四数据分量,所述第四数据分量包括第一属性信息和第二属性信息,其中n、m、M、M1、M2、M3、M4均为正整数,n大于等于m,M=M1+M2+M3+M4;
步骤S6、以所述M1个第一数据分量、M3个第三数据分量作为自变量,对应的周期结果数据作为因变量构建第一线性回归模型进行训练,获取每一第一数据分量和每一第三数据分量对应的权重和第一残差项;
步骤S7、以所述M2个第二数据分量、M4个第四数据分量的第二属性信息作为自变量,以对应的所述第一残差项作为因变量构建第二线性回归模型进训练,获取每一第二数据分量对应的权重以及每一第四数据分量对应的第一权重分量;
步骤S8、以所述M4个第四数据分量的第一属性信息、M1个去除所述第四数据分量的第一属性信息后的第一数据分量作为自变量,以对应的周期结果数据作为因变量构建第三线性回归模型进行训练,获取每一第四数据分量的第二权重分量;
步骤S9、基于每一第四数据分量的第一权重分量和第二权重分量确定每一第四数据分量的权重。
2.根据权利要求1所述的系统,其特征在于:
所述步骤S5中,第四数据分量对应的随机数据采样值包括第四数据分量采样值和对应的第一属性信息的采样值,所述步骤S5还包括:
步骤S51、根据第四数据分量采样值获取第四数据分量信息,根据第四数据分量对应的第一属性信息的采样值获取第四数据分量的第一属性信息;
步骤S52、以所述第四数据分量的第一属性信息作为自变量,以第四数据分量信息作为因变量构建进行线性回归,得到第二残差项,将所述第二残差项作为所述第四数据分量的第二属性信息。
3.根据权利要求1所述的系统,其特征在于:
所述步骤S8还包括:
步骤S81、以第四数据分量的第一属性信息作为自变量,以第一数据分量作为因变量进行线性回归,得到第三残差项,将所述第三残差项作为去除第四数据分量的第一属性信息后的第一数据分量。
4.根据权利要求1所述的系统,其特征在于:
所述步骤S9还包括:
步骤S91、以第四数据分量的第一属性信息和第一属性信息作为自变量,以第四数据分量作为因变量进行线性回归,获取到第一属性信息的权重值和第二属性信息的权重值;
步骤S92、根据第一属性信息的权重值和第二属性信息的权重值,以及第一权重分量和第二权重分量确定第四数据分量的权重。
5.根据权利要求1-4中任意一项所述的系统,其特征在于:
所述周期结果数据为X个时间-采样值的均值、中位数、最大值、最小值、最后时间采样值或最初时间采样值。
6.根据权利要求1-4中任意一项所述的系统,其特征在于:
所述每个数据分量均为对应的随机数据采样值的均值、中位数、最大值、最小值、最后时间采样值或最初时间采样值。
7.根据权利要求1-4中任意一项所述的系统,其特征在于:
所述数据分量为日频波动在预设波动范围内的数据。
8.根据权利要求7所述的系统,其特征在于:
所述日频波动范围为[-10%,10%]。
CN202011169507.1A 2020-10-28 2020-10-28 数据处理系统 Active CN112286933B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011169507.1A CN112286933B (zh) 2020-10-28 2020-10-28 数据处理系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011169507.1A CN112286933B (zh) 2020-10-28 2020-10-28 数据处理系统

Publications (2)

Publication Number Publication Date
CN112286933A CN112286933A (zh) 2021-01-29
CN112286933B true CN112286933B (zh) 2021-09-14

Family

ID=74373567

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011169507.1A Active CN112286933B (zh) 2020-10-28 2020-10-28 数据处理系统

Country Status (1)

Country Link
CN (1) CN112286933B (zh)

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273430A (zh) * 2017-05-16 2017-10-20 北京奇虎科技有限公司 一种数据存储方法和装置
CN109512395A (zh) * 2018-12-17 2019-03-26 中国科学院深圳先进技术研究院 一种生物信号的分析处理方法、装置及设备

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5444820A (en) * 1993-12-09 1995-08-22 Long Island Lighting Company Adaptive system and method for predicting response times in a service environment
EP1333382A1 (de) * 2002-01-30 2003-08-06 Agilent Technologies, Inc. (a Delaware corporation) Verfahren zur Bearbeitung von Messdaten und Vorrichtung zur Durchführung des Verfahrens
US9314209B2 (en) * 2012-09-11 2016-04-19 Covidien Lp Methods and systems for determining physiological information based on a correlation sequence
CN102915346B (zh) * 2012-09-26 2015-07-01 中国科学院软件研究所 面向物联网智能感知的数据索引建立与查询方法
US9928215B1 (en) * 2015-02-28 2018-03-27 Cloud & Stream Gears Llc Iterative simple linear regression coefficient calculation for streamed data using components
US11327797B2 (en) * 2016-05-09 2022-05-10 Oracle International Corporation Memory usage determination techniques
CN110147388A (zh) * 2017-09-29 2019-08-20 华为技术有限公司 一种数据处理的方法及装置
CN110232437B (zh) * 2019-05-30 2021-11-16 湖南大学 基于cnn的时间序列预测方法和模型确定方法
CN111311321B (zh) * 2020-02-14 2021-11-02 北京百度网讯科技有限公司 用户消费行为预测模型训练方法、装置、设备及存储介质
CN111784068A (zh) * 2020-07-09 2020-10-16 北京理工大学 基于eemd的电力负荷组合预测方法及装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107273430A (zh) * 2017-05-16 2017-10-20 北京奇虎科技有限公司 一种数据存储方法和装置
CN109512395A (zh) * 2018-12-17 2019-03-26 中国科学院深圳先进技术研究院 一种生物信号的分析处理方法、装置及设备

Also Published As

Publication number Publication date
CN112286933A (zh) 2021-01-29

Similar Documents

Publication Publication Date Title
CN105653700B (zh) 视频检索方法及系统
US20090094189A1 (en) Methods, systems, and computer program products for managing tags added by users engaged in social tagging of content
EP2874076A1 (en) Generalized graph, rule, and spatial structure based recommendation engine
US9659052B1 (en) Data object resolver
JP7082147B2 (ja) エンティティを推奨する方法及び装置、電子機器、コンピュータ読み取り可能な媒体
KR101623860B1 (ko) 문서 요소에 대한 유사도를 산출하는 방법
CN111159563A (zh) 用户兴趣点信息的确定方法、装置、设备及存储介质
Huynh et al. Context-similarity collaborative filtering recommendation
EP3499379B1 (en) Computer implemented and computer controlled method, computer program product and platform for manipulating data arranged for processing and storage at a data storage engine
EP3590053A1 (en) System and method for analysis and navigation of data
KR20120047622A (ko) 디지털 콘텐츠 관리 시스템 및 방법
Yang et al. Finding pure submodels for improved differentiation of bifactor and second-order models
CN112818195A (zh) 数据获取方法、装置、系统及计算机存储介质
CN112286933B (zh) 数据处理系统
CN112286932B (zh) 数据处理系统
US11531706B2 (en) Graph search using index vertices
Pawar et al. Movies Recommendation System using Cosine Similarity
CN110929528B (zh) 对语句情感分析的方法、装置、服务器及存储介质
CN112256730A (zh) 信息检索方法、装置、电子设备及可读存储介质
NAFIS et al. Towards a semantic recommender system for cultural objects: Case study Draa-Tafilalet region
CN117520620B (zh) 一种基于元数据的数据资源自动关联方法与系统
Shadle How libraries use publisher metadata
CN111506671B (zh) 处理实体对象的属性的方法、装置、设备及存储介质
EP3805956A1 (en) Computer implemented and computer controlled method, computer program product and platform for arranging data for processing and storage at a data storage engine
Hong et al. Personalized Information Retrieval Framework.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
TR01 Transfer of patent right

Effective date of registration: 20211223

Address after: 610095 No. 0306, block B, No. 1677, north section of Tianfu Avenue, Chengdu hi tech Zone, Chengdu pilot Free Trade Zone, Sichuan Province

Patentee after: Chengdu xichip Financial Technology Co.,Ltd.

Address before: 100020 19th floor, Guoan building, 1 guandongdian North Street, Chaoyang District, Beijing

Patentee before: FOFINVESTING TECHNOLOGY (BEIJING) CO.,LTD.

TR01 Transfer of patent right