CN114708077A - 交易流水数据处理方法及装置、存储介质及电子设备 - Google Patents
交易流水数据处理方法及装置、存储介质及电子设备 Download PDFInfo
- Publication number
- CN114708077A CN114708077A CN202210268584.5A CN202210268584A CN114708077A CN 114708077 A CN114708077 A CN 114708077A CN 202210268584 A CN202210268584 A CN 202210268584A CN 114708077 A CN114708077 A CN 114708077A
- Authority
- CN
- China
- Prior art keywords
- transaction
- parallel
- account
- data
- flow data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000003672 processing method Methods 0.000 title claims abstract description 15
- 238000000034 method Methods 0.000 claims abstract description 38
- 238000004364 calculation method Methods 0.000 claims abstract description 14
- 238000012360 testing method Methods 0.000 claims description 49
- 238000012545 processing Methods 0.000 claims description 39
- 238000012549 training Methods 0.000 claims description 22
- 238000004422 calculation algorithm Methods 0.000 claims description 8
- 238000010606 normalization Methods 0.000 claims description 8
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 5
- 238000010586 diagram Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000007635 classification algorithm Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/12—Accounting
- G06Q40/125—Finance or payroll
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2413—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on distances to training or reference patterns
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Business, Economics & Management (AREA)
- Physics & Mathematics (AREA)
- Finance (AREA)
- Accounting & Taxation (AREA)
- General Physics & Mathematics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Life Sciences & Earth Sciences (AREA)
- General Engineering & Computer Science (AREA)
- Evolutionary Biology (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Computation (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Marketing (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本申请提供了一种交易流水数据处理方法及装置、存储介质及电子设备,该方法包括:预先构建并行批次确定模型,通过并行批次确定模型,计算出运行时间最少的并行批次,并通过将各个交易流水数据划分为与并行批次对应的交易流水数据集合,从而并行计算各个交易流水数据集合包括的交易流水数据,从而提高计算时的运行效率,进而提高日均余额的计算效率。
Description
技术领域
本申请涉及数据处理技术领域,尤其涉及一种交易流水数据处理方法及装置、存储介质及电子设备。
背景技术
当前计算日均余额是直接从交易流水表中获取当日交易账户在指定天数内的交易流水数据,基于交易流水数据,直接计算指定天数内的日均余额,由于每天的交易流水量较大,直接计算指定天数内的日均余额,从而导致计算机运行效率较低,进而导致日均余额计算效率低。
发明内容
本申请提供了一种交易流水数据处理方法及装置、存储介质及电子设备,目的在于解决现有技术存在的需要消耗大量的计算机资源,从而导致计算机运行效率较低,进而导致日均余额计算效率低的问题。
为了实现上述目的,本申请提供了以下技术方案:
一种交易流水数据处理方法,包括:
获取每个目标账户在预设天数内的交易流水数据;
将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次;
基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合;
对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额;
基于每个目标账户在所述预设天数内的每日账户余额,计算每个目标账户的日均余额。
上述的方法,可选的,所述将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次,包括:
基于各个交易流水数据,统计总交易量;
将所述总交易量,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次。
上述的方法,可选的,所述并行批次确定模型的构建过程,包括:
采集历史数据集;所述历史数据集包括多个样本数据,每个样本数据包括交易量和在所述交易量下并行运行时间最少的并行批次;
对各个样本数据进行归一化处理,得到与每个样本数据对应的目标样本数据;
选取多个目标样本数据作为训练数据,并选择多个目标样本数据作为测试数据;
基于所述训练数据,对KNN分类器进行训练,并基于所述测试数据,对已训练的KNN分类器进行测试,得到测试结果;
计算所述测试结果的正确率,若所述测试结果的正确率大于预设阈值,则将已训练的KNN分类器确定为并行批次确定模型。
上述的方法,可选的,基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合,包括:
获取各个目标账户所属的开户地;
将开户地相同的各个账户的交易流水数据组成账户集合,以实现将各个交易流水数据划分为多个账户集合;
基于每个账户集合包括的交易流水数据,统计每个账户集合的交易量和交易量比值;所述交易量比值为所述账户集合的交易量与所述总交易量的比值;
基于所述总交易量和所述并行批次,计算每个批次的最大运行量;
基于每个账户集合的交易量和交易量比值、每个批次的最大运行量,通过预设的动态规划算法,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合。
上述的方法,可选的,所述对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额,包括:
对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额;
针对每个目标账户,基于所述目标账户在所述预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额,计算所述目标账户在所述预设天数内的每日账户余额。
一种交易流水数据处理装置,包括:
获取单元,用于获取每个目标账户在预设天数内的交易流水数据;
输入单元,用于将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次;
划分单元,用于基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合;
处理单元,用于对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额;
计算单元,用于基于每个目标账户在所述预设天数内的每日账户余额,计算每个目标账户的日均余额。
上述的装置,可选的,所述输入单元具体用于:
基于各个交易流水数据,统计总交易量;
将所述总交易量,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次。
上述的装置,可选的,所述输入单元在并行批次确定模型的构建过程时,具体用于:
采集历史数据集;所述历史数据集包括多个样本数据,每个样本数据包括交易量和在所述交易量下并行运行时间最少的并行批次;
对各个样本数据进行归一化处理,得到与每个样本数据对应的目标样本数据;
选取多个目标样本数据作为训练数据,并选择多个目标样本数据作为测试数据;
基于所述训练数据,对KNN分类器进行训练,并基于所述测试数据,对已训练的KNN分类器进行测试,得到测试结果;
计算所述测试结果的正确率,若所述测试结果的正确率大于预设阈值,则将已训练的KNN分类器确定为并行批次确定模型。
一种存储介质,所述存储介质存储有指令集,其中,所述指令集被处理器执行时实现如上述的交易流水数据处理方法。
一种电子设备,其特征在于,包括:
存储器,用于存储至少一组指令集;
处理器,用于执行所述存储器中存储的指令集,通过执行所述指令集实现如上述的交易流水数据处理方法。
与现有技术相比,本申请包括以下优点:
本申请提供了一种交易流水数据处理方法及装置、存储介质及电子设备,该方法包括:获取每个目标账户在预设天数内的交易流水数据;将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次;基于各个目标账户所属的开户地,将各个交易流水数据划分为与并行批次对应的交易流水数据集合;对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在预设天数内的每日账户余额;基于每个目标账户在所述预设天数内的每日账户余额,计算每个目标账户的日均余额。可见,本申请方案,预先构建并行批次确定模型,通过并行批次确定模型,计算出运行时间最少的并行批次,并通过将各个交易流水数据划分为与并行批次对应的交易流水数据集合,从而并行计算各个交易流水数据集合包括的交易流水数据,从而提高计算时的运行效率,进而提高日均余额的计算效率。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
图1为本申请提供的一种交易流水数据处理方法的方法流程图;
图2为本申请提供的一种交易流水数据处理方法的又一方法流程图;
图3为本申请提供的一种交易流水数据处理方法的再一方法流程图;
图4为本申请提供的一种交易流水数据处理方法的另一方法流程图;
图5为本申请提供的一种交易流水数据处理装置的结构示意图;
图6为本申请提供的一种电子设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
需要注意,本申请公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
需要注意,本申请公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
本申请可用于众多通用或专用的计算装置环境或配置中。例如:个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器装置、包括以上任何装置或设备的分布式计算环境等等。
本实施例中,为了便于理解,对本申请涉及的相关名词进行说明如下:
交易流水表:当日发生交易账户的交易信息,包含账号、客户号、客户名、交易日期、交易时间、交易金额和剩余金额等信息。
日均余额:账户在指定天数内每天最后时刻的账户余额的均值。
KNN:(K-NearestNeighbor,K近邻算法),一种分类算法,每个样本可以用它最接近的k个邻居来代表。
本申请实施例提供了一种交易流水数据处理方法,该方法可以应用在多种系统平台,其执行主体可以为运行在各种移动设备的处理器,所述方法的流程图如图1所示,具体包括:
S101、获取每个目标账户在预设天数内的交易流水数据。
本实施例中,获取每个目标账户在预设天数内的交易流水数据,具体的,基于交易流水表,获取每个目标账户在预设天数内的交易流水数据。
其中,目标账户为当天发生过交易的账户。
示例性的,交易流水数据包括账号、客户号、客户名、交易日期、交易时间、交易金额和剩余金额等信息。
S102、将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次。
本实施例中,预先构建并行批次确定模型。
参阅图2,并行批次确定模型的构建过程,包括以下步骤:
S201、采集历史数据集。
本实施例中,采集历史数据集,历史数据集包括多个样本数据,每个样本数据包括交易量和在该交易量下并行运行时间最少的并行批次。
示例性的,每个样本数据的数据格式为[交易量,并行批次n]。
S202、对各个样本数据进行归一化处理,得到与每个样本数据对应的目标样本数据。
本实施例中,对各个样本数据进行归一化处理,将所有的样本数据映射到同一数据范围内,从而得到与每个样本数据对应的目标样本数据。
需要说明的是,对各个样本数据进行归一化处理的具体过程请参见现有技术,此处不再赘述。
本实施例通过对各个样本数据进行归一化处理,以提高计算机的运算速度。
S203、选取多个目标样本数据作为训练数据,并选择多个目标样本数据作为测试数据。
本实施例中,随机选取多个目标样本数据作为训练数据,并随机选择多个目标样本数据作为测试数据。
需要说明的是,训练数据的数据量与测试数据的数据量之和与目标样本数据的数据量相等。
S204、基于训练数据,对KNN分类器进行训练,并基于测试数据,对已训练的KNN分类器进行测试,得到测试结果。
本实施例中,基于训练数据,对KNN分类器进行训练。
本实施例中,在完成对KNN分类器的训练后,基于测试数据,对已训练的KNN分类器进行测试,得到测试结果。
S205、计算测试结果的正确率,若测试结果的正确率大于预设阈值,则将已训练的KNN分类器确定为并行批次确定模型。
本实施例中,计算测试测结果的正确率,具体的,统计测试结果中表征测试结果正确的测试结果的数量,基于表征测试结果正确的测试结果的数量,和总的测试结果的数量,计算测试结果的正确率。
判断测试结果的正确率是否大于预设阈值,若测试结果的正确率大于预设阈值,则将已训练的KNN分类器确定为并行批次确定模型。
本申请实施例提供的方法中,将各个交易流水数据,输入至预先构建的并行批次确定模型中,经过并行批次确定模型的处理,得到并行运行时间最少的并行批次。
本实施例中,将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次的过程,具体包括以下步骤:
基于各个交易流水数据,统计总交易量;
将总交易量,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次。
本实施例中,先基于各个交易流水数据,统计总交易量,再将总交易量,输入至预先构建的并行批次确定模型中,从而得到并行运行时间最少的并行批次。
S103、基于各个目标账户所属的开户地,将各个交易流水数据划分为与并行批次对应的交易流水数据集合。
本实施例中,基于各个目标账户所属的开户地,将各个交易流水数据划分为与并行批次对应的交易流水数据集合。需要说明的是,划分得到的交易流水数据集合的集合个数与并行批次对应。例如,并行批次为3,则划分得到的交易流水数据集合的集合个数也是3。
参阅图3,基于各个目标账户所属的开户地,将各个交易流水数据划分为与并行批次对应的交易流水数据集合的过程,具体包括以下步骤:
S301、获取各个目标账户所属的开户地。
本实施例中,获取各个目标账户所述的开户地,具体的,基于每个目标账户的账户信息,确定每个目标账户所属的开户地。
S302、将开户地相同的各个账户的交易流水数据组成账户集合,以实现将各个交易流水数据划分为多个账户集合。
本实施例中,将开户地相同的各个账户的交易流水数据组成账户集合,也就是将开户地相同的账户的交易流水数据组成一个账户集合,从而实现将各个交易流水数据划分为多个账户集合。
S303、基于每个账户集合包括的交易流水数据,统计每个账户集合的交易量和交易量比值。
本实施例中,基于每个账户集合包括的交易流水数据,统计每个账户集合的交易量。
针对每个账户集合,基于该账户集合的交易量与总交易量,计算该账户集合的交易量比值,也就是说,交易量比值为账户集合的交易量与总交易量的比值。
S304、基于总交易量和并行批次,计算每个批次的最大运行量。
本实施例中,基于总交易量和并行批次,计算每个批次的预计运行量,具体的,将总交易量除以并行批次,得到每个批次的最大运行量。
S305、基于每个账户集合的交易量和交易量比值、每个批次的最大运行量,通过预设的动态规划算法,将各个交易流水数据划分为与并行批次对应的交易流水数据集合。
本实施例中,基于每个账户集合的交易量和交易量比值、每个批次的最大运行量,通过预设的动态规划算法,将各个交易流水数据划分为与并行批次对应的交易流水数据集合。
具体的,基于每个账户集合的交易量和交易量比值、每个批次的最大运行量,通过预设的动态规划算法,将各个交易流水数据划分为与并行批次对应的交易流水数据集合的过程,同“01背包问题”的实现过程类似,其中,账户集合的交易量对应“01背包问题”中的物品的重量,账户集合的交易量比值对应“01背包问题”中的物品的价值,每个批次的最大运行量对应“01背包问题”中的背包的容量。
定义变量,Vi表示第i个物品的价值,Wi表示第i个物品的体积,V(i,j)表示当前的背包容量j时,前i个物品的最佳组合的总价值,从而可建立以下递推公式:
A.若A.j<w(i),则V(i,j)=V(i-1,j);
B.若j>=w(i),则V(i,j)=max{V(i-1,j),V(i-1,j-W(i))+V(i)}。
其中,A情况表示背包的容量小于第i个物品的体积,无法容纳,此时的总价值与前i-1个物品的价值一样;B情况表示,可以容纳第i个物品,从放入第i个物品得到的价值和不放入第i个物品得到的价值中选择最大价值,以确定是否放入第i个物品。其中,V(i)表示第i个物品的价值,V(i-1,j-W(i))表示,在背包体积为j-W(i)时,前i-1个物品的总价值。
由此可以实现将各个交易流水数据划分为与并行批次对应的交易流水数据集合。
需要说明的是,本申请使用动态规划算法将交易流水数据均匀划分,以便之后进行并行计算,以快速计算出日均余额,降低计算时所需的时间。
S104、对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在预设天数内的每日账户余额。
本实施例中,对各个交易流水数据集合包括的交易流水数据进行并行处理,从而得到每个目标账户在预设天数内的每日账户余额。
参阅图4,对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在预设天数内的每日账户余额的过程,具体包括以下步骤:
S401、对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额。
本实施例中,对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在预设天数内的每一天的最晚时间的账户余额和最早时间的交易前金额,具体的,对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在当日的最晚时间的账户余额和最早时间的交易前金额,并基于每个目标账户在当日的最晚时间的账户余额和最早时间的交易前金额,往前倒推预设天数,从而每个目标账户在预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额。
S402、针对每个目标账户,基于目标账户在预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额,计算目标账户在预设天数内的每日账户余额。
本实施例中,针对每个目标账户,基于目标账户在预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额,从而计算得到目标账户在预设天数内的每日账户余额。
S105、基于每个目标账户在预设天数内的每日账户余额,计算每个目标账户的日均余额。
本实施例中,基于每个目标账户在预设天数内的每日账户余额,计算每个目标账户的日均余额。
具体的,针对每个目标账户,对该目标账户在预设天数内的每日账户余额进行累加,得到累加值,将累加值除以预设天数,得到该目标账户的日均余额。
本申请实施例提供的交易流水数据处理方法,预先构建并行批次确定模型,通过并行批次确定模型,计算出运行时间最少的并行批次,并通过将各个交易流水数据划分为与并行批次对应的交易流水数据集合,从而并行计算各个交易流水数据集合包括的交易流水数据,从而提高计算时的运行效率,进而提高日均余额的计算效率。
需要说明的是,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。
应当理解,本申请公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本申请公开的范围在此方面不受限制。
与图1所述的方法相对应,本申请实施例还提供了一种交易流水数据处理装置,用于对图1中方法的具体实现,其结构示意图如图5所示,具体包括:
获取单元501,用于获取每个目标账户在预设天数内的交易流水数据;
输入单元502,用于将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次;
划分单元503,用于基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合;
处理单元504,用于对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额;
计算单元505,用于基于每个目标账户在所述预设天数内的每日账户余额,计算每个目标账户的日均余额。
本申请实施例提供的交易流水数据处理装置,预先构建并行批次确定模型,通过并行批次确定模型,计算出运行时间最少的并行批次,并通过将各个交易流水数据划分为与并行批次对应的交易流水数据集合,从而并行计算各个交易流水数据集合包括的交易流水数据,从而提高计算时的运行效率,进而提高日均余额的计算效率。
在本申请的一个实施例中,基于前述方案,输入单元502具体用于:
基于各个交易流水数据,统计总交易量;
将所述总交易量,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次。
在本申请的一个实施例中,基于前述方案,输入单元502在并行批次确定模型的构建过程时,具体用于:
采集历史数据集;所述历史数据集包括多个样本数据,每个样本数据包括交易量和在所述交易量下并行运行时间最少的并行批次;
对各个样本数据进行归一化处理,得到与每个样本数据对应的目标样本数据;
选取多个目标样本数据作为训练数据,并选择多个目标样本数据作为测试数据;
基于所述训练数据,对KNN分类器进行训练,并基于所述测试数据,对已训练的KNN分类器进行测试,得到测试结果;
计算所述测试结果的正确率,若所述测试结果的正确率大于预设阈值,则将已训练的KNN分类器确定为并行批次确定模型。
在本申请的一个实施例中,基于前述方案,划分单元503具体用于:
获取各个目标账户所属的开户地;
将开户地相同的各个账户的交易流水数据组成账户集合,以实现将各个交易流水数据划分为多个账户集合;
基于每个账户集合包括的交易流水数据,统计每个账户集合的交易量和交易量比值;所述交易量比值为所述账户集合的交易量与所述总交易量的比值;
基于所述总交易量和所述并行批次,计算每个批次的最大运行量;
基于每个账户集合的交易量和交易量比值、每个批次的最大运行量,通过预设的动态规划算法,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合。
在本申请的一个实施例中,基于前述方案,处理单元504具体用于:
对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额;
针对每个目标账户,基于所述目标账户在所述预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额,计算所述目标账户在所述预设天数内的每日账户余额。
本申请实施例还提供了一种存储介质,所述存储介质存储有指令集,其中,在所述指令集运行时执行以下操作:
获取每个目标账户在预设天数内的交易流水数据;
将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次;
基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合;
对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额;
基于每个目标账户在所述预设天数内的每日账户余额,计算每个目标账户的日均余额。
本申请实施例还提供了一种电子设备,其结构示意图如图6所示,具体包括存储器601,用于存储至少一组指令集;处理器602,用于执行所述存储器中存储的指令集,通过执行所述指令集实现以下操作:
获取每个目标账户在预设天数内的交易流水数据;
将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次;
基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合;
对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额;
基于每个目标账户在所述预设天数内的每日账户余额,计算每个目标账户的日均余额。
尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本申请公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
以上描述仅为本申请公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本申请公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本申请公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
Claims (10)
1.一种交易流水数据处理方法,其特征在于,包括:
获取每个目标账户在预设天数内的交易流水数据;
将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次;
基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合;
对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额;
基于每个目标账户在所述预设天数内的每日账户余额,计算每个目标账户的日均余额。
2.根据权利要求1所述的方法,其特征在于,所述将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次,包括:
基于各个交易流水数据,统计总交易量;
将所述总交易量,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次。
3.根据权利要求1或2所述的方法,其特征在于,所述并行批次确定模型的构建过程,包括:
采集历史数据集;所述历史数据集包括多个样本数据,每个样本数据包括交易量和在所述交易量下并行运行时间最少的并行批次;
对各个样本数据进行归一化处理,得到与每个样本数据对应的目标样本数据;
选取多个目标样本数据作为训练数据,并选择多个目标样本数据作为测试数据;
基于所述训练数据,对KNN分类器进行训练,并基于所述测试数据,对已训练的KNN分类器进行测试,得到测试结果;
计算所述测试结果的正确率,若所述测试结果的正确率大于预设阈值,则将已训练的KNN分类器确定为并行批次确定模型。
4.根据权利要求2所述的方法,其特征在于,基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合,包括:
获取各个目标账户所属的开户地;
将开户地相同的各个账户的交易流水数据组成账户集合,以实现将各个交易流水数据划分为多个账户集合;
基于每个账户集合包括的交易流水数据,统计每个账户集合的交易量和交易量比值;所述交易量比值为所述账户集合的交易量与所述总交易量的比值;
基于所述总交易量和所述并行批次,计算每个批次的最大运行量;
基于每个账户集合的交易量和交易量比值、每个批次的最大运行量,通过预设的动态规划算法,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合。
5.根据权利要求1所述的方法,其特征在于,所述对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额,包括:
对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额;
针对每个目标账户,基于所述目标账户在所述预设天数内每一天的最晚时间的账户余额和最早时间的交易前金额,计算所述目标账户在所述预设天数内的每日账户余额。
6.一种交易流水数据处理装置,其特征在于,包括:
获取单元,用于获取每个目标账户在预设天数内的交易流水数据;
输入单元,用于将各个交易流水数据,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次;
划分单元,用于基于各个目标账户所属的开户地,将各个交易流水数据划分为与所述并行批次对应的交易流水数据集合;
处理单元,用于对各个交易流水数据集合包括的交易流水数据进行并行处理,得到每个目标账户在所述预设天数内的每日账户余额;
计算单元,用于基于每个目标账户在所述预设天数内的每日账户余额,计算每个目标账户的日均余额。
7.根据权利要求6所述的装置,其特征在于,所述输入单元具体用于:
基于各个交易流水数据,统计总交易量;
将所述总交易量,输入至预先构建的并行批次确定模型中,得到并行运行时间最少的并行批次。
8.根据权利要求6或7所述的装置,其特征在于,所述输入单元在并行批次确定模型的构建过程时,具体用于:
采集历史数据集;所述历史数据集包括多个样本数据,每个样本数据包括交易量和在所述交易量下并行运行时间最少的并行批次;
对各个样本数据进行归一化处理,得到与每个样本数据对应的目标样本数据;
选取多个目标样本数据作为训练数据,并选择多个目标样本数据作为测试数据;
基于所述训练数据,对KNN分类器进行训练,并基于所述测试数据,对已训练的KNN分类器进行测试,得到测试结果;
计算所述测试结果的正确率,若所述测试结果的正确率大于预设阈值,则将已训练的KNN分类器确定为并行批次确定模型。
9.一种存储介质,其特征在于,所述存储介质存储有指令集,其中,所述指令集被处理器执行时实现如权利要求1-5任意一项所述的交易流水数据处理方法。
10.一种电子设备,其特征在于,包括:
存储器,用于存储至少一组指令集;
处理器,用于执行所述存储器中存储的指令集,通过执行所述指令集实现如权利要求1-5任意一项所述的交易流水数据处理方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210268584.5A CN114708077A (zh) | 2022-03-18 | 2022-03-18 | 交易流水数据处理方法及装置、存储介质及电子设备 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202210268584.5A CN114708077A (zh) | 2022-03-18 | 2022-03-18 | 交易流水数据处理方法及装置、存储介质及电子设备 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114708077A true CN114708077A (zh) | 2022-07-05 |
Family
ID=82168476
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202210268584.5A Pending CN114708077A (zh) | 2022-03-18 | 2022-03-18 | 交易流水数据处理方法及装置、存储介质及电子设备 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114708077A (zh) |
Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110347513A (zh) * | 2019-07-15 | 2019-10-18 | 中国工商银行股份有限公司 | 热点数据批量调度方法及装置 |
CN113177609A (zh) * | 2021-05-21 | 2021-07-27 | 中国工商银行股份有限公司 | 数据类别不均衡的处理方法及设备、系统、存储介质 |
CN113628021A (zh) * | 2021-07-30 | 2021-11-09 | 北京乾元大通技术有限公司 | 一种高效的会计核算系统 |
CN113971495A (zh) * | 2021-11-02 | 2022-01-25 | 中国银行股份有限公司 | 日间批量处理方法及装置 |
-
2022
- 2022-03-18 CN CN202210268584.5A patent/CN114708077A/zh active Pending
Patent Citations (4)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110347513A (zh) * | 2019-07-15 | 2019-10-18 | 中国工商银行股份有限公司 | 热点数据批量调度方法及装置 |
CN113177609A (zh) * | 2021-05-21 | 2021-07-27 | 中国工商银行股份有限公司 | 数据类别不均衡的处理方法及设备、系统、存储介质 |
CN113628021A (zh) * | 2021-07-30 | 2021-11-09 | 北京乾元大通技术有限公司 | 一种高效的会计核算系统 |
CN113971495A (zh) * | 2021-11-02 | 2022-01-25 | 中国银行股份有限公司 | 日间批量处理方法及装置 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN108833458B (zh) | 一种应用推荐方法、装置、介质及设备 | |
CN104182278B (zh) | 一种判定计算机硬件资源繁忙程度的方法和装置 | |
CN109636212B (zh) | 作业实际运行时间的预测方法 | |
CN110909878A (zh) | 预估资源使用份额的神经网络模型的训练方法和装置 | |
CN109829592A (zh) | 一种快递柜用户的流失预测方法、装置、设备和存储介质 | |
CN107480703B (zh) | 交易故障检测方法及装置 | |
CN113034171A (zh) | 一种业务数据处理方法、装置、计算机及可读存储介质 | |
CN113268403A (zh) | 时间序列的分析预测方法、装置、设备及存储介质 | |
Dwiyanti et al. | Handling imbalanced data in churn prediction using rusboost and feature selection (case study: Pt. telekomunikasi indonesia regional 7) | |
CN110046770B (zh) | 粮食霉变预测方法及装置 | |
CN116225708A (zh) | 一种gpu资源调度方法及装置 | |
CN116544999A (zh) | 储能系统的装机容量确定方法、装置、设备和介质 | |
CN117633571A (zh) | 一种基于多重聚类的异常用户预警方法及装置 | |
CN110796591A (zh) | 一种gpu卡的使用方法及相关设备 | |
CN113506023A (zh) | 工作行为数据分析方法、装置、设备及存储介质 | |
CN113342604A (zh) | 内存使用率的检测方法、装置、终端及存储介质 | |
CN115238837B (zh) | 一种数据处理方法、装置、电子设备及存储介质 | |
CN114708077A (zh) | 交易流水数据处理方法及装置、存储介质及电子设备 | |
CN113689020A (zh) | 业务信息预测方法、装置、计算机设备和存储介质 | |
WO2022267364A1 (zh) | 一种信息推荐方法、设备及存储介质 | |
CN111597299A (zh) | 知识点监测方法、装置、计算机设备和存储介质 | |
CN110796379A (zh) | 业务渠道的风险评估方法、装置、设备及存储介质 | |
CN110705975A (zh) | 一种扣款指令发起方法及装置 | |
CN106156470B (zh) | 一种时间序列异常检测标注方法及系统 | |
CN114090407A (zh) | 基于线性回归模型的接口性能预警方法及其相关设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |