CN117829362A - 账户执行交易行为的意向指数预测方法及装置 - Google Patents
账户执行交易行为的意向指数预测方法及装置 Download PDFInfo
- Publication number
- CN117829362A CN117829362A CN202311873266.2A CN202311873266A CN117829362A CN 117829362 A CN117829362 A CN 117829362A CN 202311873266 A CN202311873266 A CN 202311873266A CN 117829362 A CN117829362 A CN 117829362A
- Authority
- CN
- China
- Prior art keywords
- transaction
- transaction data
- target
- account
- time
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 77
- 230000006399 behavior Effects 0.000 claims abstract description 124
- 238000012545 processing Methods 0.000 claims abstract description 37
- 230000002159 abnormal effect Effects 0.000 claims description 51
- 230000004044 response Effects 0.000 claims description 36
- 230000015654 memory Effects 0.000 claims description 29
- 230000000694 effects Effects 0.000 claims description 18
- 230000009467 reduction Effects 0.000 claims description 15
- 238000012549 training Methods 0.000 claims description 10
- 238000012216 screening Methods 0.000 claims description 8
- 238000000605 extraction Methods 0.000 claims description 5
- 230000008569 process Effects 0.000 description 16
- 238000003860 storage Methods 0.000 description 16
- 238000010586 diagram Methods 0.000 description 11
- 238000004590 computer program Methods 0.000 description 10
- 230000006870 function Effects 0.000 description 5
- 230000003287 optical effect Effects 0.000 description 4
- 230000005856 abnormality Effects 0.000 description 3
- 238000013528 artificial neural network Methods 0.000 description 3
- 230000001537 neural effect Effects 0.000 description 3
- 230000001960 triggered effect Effects 0.000 description 3
- 238000004458 analytical method Methods 0.000 description 2
- 230000005540 biological transmission Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 125000004122 cyclic group Chemical group 0.000 description 2
- 238000005516 engineering process Methods 0.000 description 2
- 238000011156 evaluation Methods 0.000 description 2
- 230000007774 longterm Effects 0.000 description 2
- 238000007726 management method Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000000737 periodic effect Effects 0.000 description 2
- 230000000306 recurrent effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000012935 Averaging Methods 0.000 description 1
- 230000009471 action Effects 0.000 description 1
- 238000004422 calculation algorithm Methods 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 210000004027 cell Anatomy 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000007418 data mining Methods 0.000 description 1
- 238000013499 data model Methods 0.000 description 1
- 238000009826 distribution Methods 0.000 description 1
- 230000010365 information processing Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 238000004519 manufacturing process Methods 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 210000005036 nerve Anatomy 0.000 description 1
- 210000002569 neuron Anatomy 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000000746 purification Methods 0.000 description 1
- 238000004445 quantitative analysis Methods 0.000 description 1
- 238000013139 quantization Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
- 238000000638 solvent extraction Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 238000012731 temporal analysis Methods 0.000 description 1
- 238000000700 time series analysis Methods 0.000 description 1
- 238000012546 transfer Methods 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/04—Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/23—Clustering techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/04—Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- Data Mining & Analysis (AREA)
- Strategic Management (AREA)
- Economics (AREA)
- General Physics & Mathematics (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Human Resources & Organizations (AREA)
- Marketing (AREA)
- Development Economics (AREA)
- Finance (AREA)
- Artificial Intelligence (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Technology Law (AREA)
- Bioinformatics & Computational Biology (AREA)
- Game Theory and Decision Science (AREA)
- General Engineering & Computer Science (AREA)
- Entrepreneurship & Innovation (AREA)
- Operations Research (AREA)
- Quality & Reliability (AREA)
- Tourism & Hospitality (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明公开了一种账户执行交易行为的意向指数预测方法及装置。涉及数据处理领域,该方法包括:接收并响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,并确定与目标账户对应的账户属性信息;对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果;依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群;将时序交易数据输入至意向预测模型得到意向指数。本发明解决了相关技术中难以准确预测目标账户执行交易行为的意向指数的技术问题。
Description
技术领域
本发明涉及数据处理领域,具体而言,涉及一种账户执行交易行为的意向指数预测方法及装置。
背景技术
在数字化运营场景的不断扩张中,任何行为都存在一定的潜在的、或多或少的相关性。但是相关技术中的方案,难以准确捕捉到行为之间的相关性。进而难以进行预测。因此,相关技术中,存在难以准确预测目标账户执行交易行为的意向指数的技术问题。
针对上述的问题,目前尚未提出有效的解决方案。
发明内容
本发明实施例提供了一种账户执行交易行为的意向指数预测方法及装置,以至少解决相关技术中难以准确预测目标账户执行交易行为的意向指数的技术问题。
根据本发明实施例的一个方面,提供了一种账户执行交易行为的意向指数预测方法,包括:接收意向指数预测请求,其中,所述意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;响应于所述意向指数预测请求,确定所述目标账户在所述当前时间之前的过去时间段内与所述目标交易行为相关的时序交易数据,并确定与所述目标账户对应的账户属性信息;对所述时序交易数据进行聚类处理,得到所述时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对所述账户属性信息进行聚类处理,得到所述账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;依据所述第一聚类结果与所述第二聚类结果,确定所述目标账户对应的聚类客群;将所述时序交易数据输入至与所述聚类客群对应的意向预测模型中,得到意向指数,其中,所述意向预测模型为依据样本数据训练得到的模型,所述样本数据包括样本账户在所述过去时间段内与预定交易行为的样本时序交易数据,与所述样本账户对应的样本意向指数,所述预定交易行为包括所述目标交易行为。
可选地,所述将所述时序交易数据输入至与所述聚类客群对应的意向预测模型中,得到意向指数之前,还包括:获取N个初始模型,其中,所述N个初始模型设置有不同的模型参数,所述模型参数包括:滑块时域区间,准入滑块数量,N为大于1的整数;依据所述样本数据对所述N个初始模型分别进行训练,得到N个目标模型;确定与所述N个目标模型分别对应的均方误差;从所述N个目标模型中,确定与最小均方误差对应的模型为所述意向预测模型。
可选地,所述响应于所述意向指数预测请求,确定所述目标账户在所述当前时间之前的过去时间段内与所述目标交易行为相关的时序交易数据,包括:响应于所述意向指数预测请求,获取所述目标账户在过去时间段内与所述目标交易行为相关的初始时序交易数据;在所述初始时序交易数据中存在M个与所述目标交易行为相关的行为的情况下,依据与M个行为分别对应的子时序交易数据,确定所述初始时序交易数据有无异常的异常结果,其中,M为大于1的整数;在所述异常结果为所述初始时序交易数据无异常的情况下,将所述初始时序交易数据作为所述时序交易数据。
可选地,所述依据与M个行为分别对应的子时序交易数据,确定所述初始时序交易数据有无异常的异常结果之后,还包括:在所述异常结果为所述初始时序交易数据中存在异常的情况下,从所述初始时序交易数据中筛除异常的子时序交易数据,得到筛除时序交易数据;将所述筛除时序交易数据作为所述时序交易数据。
可选地,所述响应于所述意向指数预测请求,确定所述目标账户在所述当前时间之前的过去时间段内与所述目标交易行为相关的时序交易数据,包括:响应于所述意向指数预测请求,获取所述目标账户在过去时间段内与所述目标交易行为相关的初始时序交易数据:从所述初始时序交易数据中,依据预定时间间隔选取时序交易数据作为所述时序交易数据。
可选地,所述将所述时序交易数据输入至与所述聚类客群对应的意向预测模型中,得到意向指数,包括:将所述时序交易数据输入至与所述意向预测模型的特征提取模块中,提取所述时序交易数据的特征,得到多维度的多维度交易特征;将所述多维度交易特征输入至所述意向预测模型的特征降维模块中,对所述多维度交易特征进行降维处理,得到单一维度的单一维度交易特征;将所述单一维度交易特征输入至所述意向预测模型中的指数预测模型中,得到所述意向指数。
可选地,所述对所述时序交易数据进行聚类处理,得到所述时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对所述账户属性信息进行聚类处理,得到所述账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果之前,还包括:获取样本时序交易数据与样本属性信息;聚类处理所述样本时序交易数据,得到所述P个交易聚类簇,并聚类处理所述样本属性信息,得到所述Q个属性聚类簇。
根据本发明实施例的一个方面,提供了一种账户执行交易行为的意向指数预测装置,包括:接收模块,用于接收意向指数预测请求,其中,所述意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;第一确定模块,用于响应于所述意向指数预测请求,确定所述目标账户在所述当前时间之前的过去时间段内与所述目标交易行为相关的时序交易数据,并确定与所述目标账户对应的账户属性信息;聚类模块,用于对所述时序交易数据进行聚类处理,得到所述时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对所述账户属性信息进行聚类处理,得到所述账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;第二确定模块,用于依据所述第一聚类结果与所述第二聚类结果,确定所述目标账户对应的聚类客群;预测模块,用于将所述时序交易数据输入至与所述聚类客群对应的意向预测模型中,得到意向指数,其中,所述意向预测模型为依据样本数据训练得到的模型,所述样本数据包括样本账户在所述过去时间段内与预定交易行为的样本时序交易数据,与所述样本账户对应的样本意向指数,所述预定交易行为包括所述目标交易行为。
根据本发明实施例的一个方面,提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行上述任意一项所述的方法。
根据本发明实施例的一个方面,提供了一种电子设备,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现上述任意一项所述的方法。
在本发明实施例中,接收意向指数预测请求,意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数。响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,并确定与目标账户对应的账户属性信息。对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果。依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群。将时序交易数据输入至与聚类客群对应的意向预测模型中,达到得到意向指数的目的。由于先对目标账户的时序交易数据,以及账户属性信息分别进行了聚类处理,确定出了目标账户在交易数据上所属的类别,以及目标账户在属性信息上所属的类别,判断出目标账户所属的聚类客群。进而,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数。由于意向预测模型是与聚类客群所对应的模型,因此,达到了更具针对性、准确地预测。进而解决了相关技术中难以准确预测目标账户执行交易行为的意向指数的技术问题。
附图说明
构成本申请的一部分的附图用来提供对本申请的进一步理解,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例提供的账户执行交易行为的意向指数预测方法的流程图;
图2是本发明可选实施方式提供的模型训练步骤的示意图;
图3是根据本申请实施例提供的账户执行交易行为的意向指数预测装置的结构框图;
图4是本发明实施例提供的电子设备的示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本公开所涉及的相关信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于展示的数据、分析的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
下面对本申请中出现的术语进行解释:
GRU(Gate Recurrent Unit)神经单元:是循环神经网络(RNN)的一种变体,主要用于解决RNN无法长期记忆和反向传播中的梯度问题。它通过门控单元控制信息的流动,能够更好地捕捉时间序列数据中的长期依赖关系,从而提高模型的性能。
GRU时序衍生模型:指基于GRU神经单元的时序模型,通常用于处理序列数据。这种模型通过捕捉序列数据中的长期依赖关系,能够更好地预测未来的趋势和模式。与传统的循环神经网络(RNN)相比,GRU时序衍生模型具有更好的记忆和信息处理能力,能够更好地处理复杂的时序数据。常见的应用领域包括时间序列分析、自然语言处理、语音识别等。
下面结合优选的实施步骤对本发明进行说明,图1是根据本申请实施例提供的账户执行交易行为的意向指数预测方法的流程图,如图1所示,该方法包括如下步骤:
步骤S102,接收意向指数预测请求,其中,意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;
在本申请所提供的步骤S102中,接收意向指数预测请求,意向指数预测请求可以是响应于用户行为所触发的,也可以是定时触发的,也可以是当其他系统或服务状态发生变化时所触发的,等等。具体如何触发可以结合实际的应用与场景进行自定义的设置。意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数,如,某个账户在未来一个月内执行消费行为的意向指数。其中,意向指数表示账户在未来时间段内执行目标交易行为的可能性程度。
步骤S104,响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,并确定与目标账户对应的账户属性信息;
在本申请所提供的步骤S104中,响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,即,从与目标账户相关的多样交易数据中,仅确定与目标交易行为相关的时序交易数据,如,目标交易行为为购买行为时,就只确定与购买行为相关的时序交易数据。
还响应于意向指数预测请求,确定了与目标账户对应的账户属性信息,其中,账户属性信息可以有多种。如账户基本信息:账户的名称、号码、类型(例如个人账户、公司账户等)、开户日期等。账户资金信息、例如账户的可用余额、已冻结资金、总资产、总负债等。安全信息,例如账户的安全设置、安全等级、绑定的手机号码等。账户权限和等级,例如账户的权限设置,例如管理员、普通用户等不同等级的权限等等。通过了解账户属性信息,有利于确定与使用账户的用户相关的静态信息、画像信息。
步骤S106,对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;
在本申请所提供的步骤S106中,对时序交易数据聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,具体方式可以为确定时序交易数据与P个交易聚类簇中每个簇的中心点的距离,确定最近距离对应的簇为目标交易簇。即,确定出时序交易数据所属的簇。
还对账户属性信息进行了聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,具体方式可以为确定账户属性信息与Q个属性聚类簇中每个簇的中心点的距离,确定最近距离对应的簇为目标属性簇。即,确定出账户属性信息所属的簇。
步骤S108,依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群;
在本申请所提供的步骤S108中,依据第一聚类结果与第二聚类结果,即,依据目标交易簇与目标属性簇,确定了目标账户对应的聚类客群。可以理解为,确定出的聚类客群,又是与目标交易簇对应的客群,又是与目标属性簇对应的客群。
步骤S110,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,其中,意向预测模型为依据样本数据训练得到的模型,样本数据包括样本账户在过去时间段内与预定交易行为的样本时序交易数据,与样本账户对应的样本意向指数,预定交易行为包括目标交易行为。
在本申请所提供的步骤S110中,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,在本步骤中,通过模型进行了对时序交易数据的预测,得到了意向指数。能够提高得到意向指数的准确性与可靠性,以及提高了模型预测的效率。而且意向预测模型为依据样本数据训练得到的模型,样本数据包括样本账户在过去时间段内与预定交易行为的样本时序交易数据,与样本账户对应的样本意向指数,使其能够更好地学习到特征。而且,由于模型是依据预定交易行为对应的样本数据进行训练的,预定交易行为又包括目标交易行为,在保证预测准确性的同时,使得本申请所涉及的模型又不至于过多过细,减少了本申请所提供方法所消耗的算力。
通过上述步骤,接收意向指数预测请求,意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数。响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,并确定与目标账户对应的账户属性信息。对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果。依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群。将时序交易数据输入至与聚类客群对应的意向预测模型中,达到得到意向指数的目的。由于先对目标账户的时序交易数据,以及账户属性信息分别进行了聚类处理,确定出了目标账户在交易数据上所属的类别,以及目标账户在属性信息上所属的类别,判断出目标账户所属的聚类客群。进而,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数。由于意向预测模型是与聚类客群所对应的模型,因此,达到了更具针对性、准确地预测。进而解决了相关技术中难以准确预测目标账户执行交易行为的意向指数的技术问题。
作为一种可选的实施例,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数之前,还包括:获取N个初始模型,其中,N个初始模型设置有不同的模型参数,模型参数包括:滑块时域区间,准入滑块数量,N为大于1的整数;依据样本数据对N个初始模型分别进行训练,得到N个目标模型;确定与N个目标模型分别对应的均方误差;从N个目标模型中,确定与最小均方误差对应的模型为意向预测模型。
在该实施例中,说明了从配置有不同模型参数的多个模型中确定出意向预测模型中的步骤。从多个目标模型中确定出意向预测模型的依据即为均方误差。模型的均方误差(Mean Squared Error,MSE)是一种常见的评估模型预测精度的指标。它计算的是模型预测值与实际值之间差的平方的平均值。均方误差的值越小,说明模型的预测精度越高。这是因为MSE考虑了每个样本点的误差,并对误差进行了平方,这样大的误差就会被放大,小的误差就会被缩小。最后再对所有样本点的误差进行平均,得到一个综合的评价指标。因此,通过最小均方误差的模型为多个目标模型中预测最准确的模型。
配置有不同模型参数的多个模型,模型参数不同在滑块时域区间与准入滑块数量,滑块时域区间是指在时间域上滑块的移动范围或时间窗口,通常用于描述滑块在某个时间段内的移动或变化。准入滑块数量则是指允许进入该时域区间的滑块数量,即在该时间段内可以有多少个滑块进行移动或变化。在本实施例中,通过设定不同时间滑块时域区间(时序交易数据统计最小时间区间)和模型准入滑块数量(具体使用几组交易数据滑块)构建不同准入维度的初始模型,通过对每组初始模型进行训练后,进行MSE(均方误差)指标评估,MSE值越小,表明目标模型对于目标数值的拟合效果越准确,预测精度越高,故以此确定最优模型。
作为一种可选的实施例,响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,包括:响应于意向指数预测请求,获取目标账户在过去时间段内与目标交易行为相关的初始时序交易数据;在初始时序交易数据中存在M个与目标交易行为相关的行为的情况下,依据与M个行为分别对应的子时序交易数据,确定初始时序交易数据有无异常的异常结果,其中,M为大于1的整数;在异常结果为初始时序交易数据无异常的情况下,将初始时序交易数据作为时序交易数据。
在该实施例中,说明了确定初始时序交易数据有无异常的异常结果的步骤。通过获取目标账户在过去时间段内与目标交易行为相关的初始时序交易数据,即,获取了初始的全部与目标交易行为相关的数据。在初始时序交易数据中存在M个与目标交易行为相关的行为的情况下,即M个行为分别对应有不同的数据,将其称为子时序交易数据。依据与M个行为分别对应的子时序交易数据,确定初始时序交易数据有无异常的异常结果。即,可以查看不同的子时序交易数据之间的相似性,如果之间差异过大,可以认为其有异常的可能。
由于在真实业务办理过程中,部分客户在进行银行信贷业务或者其他交易业务的办理过程中,可能会存在部分流水造假,以便提升信贷额度或达到准入门槛等需求,故需要先对已有流水明细进行探查、评估、过滤处理,即确定初始时序交易数据有无异常的异常结果,以针对性地进行处理。
在该实施例中,在确定异常结果为初始时序交易数据无异常的情况下,才会将初始时序交易数据作为时序交易数据,以保证后续方法的有序执行,避免异常数据干扰所造成的预测错误的问题。
作为一种可选的实施例,依据与M个行为分别对应的子时序交易数据,确定初始时序交易数据有无异常的异常结果之后,还包括:在异常结果为初始时序交易数据中存在异常的情况下,从初始时序交易数据中筛除异常的子时序交易数据,得到筛除时序交易数据;将筛除时序交易数据作为时序交易数据。
在该实施例中,说明了确定初始时序交易数据有无异常的异常结果的另一种情况,即,异常结果为初始时序交易数据中存在异常的情况。在该情况下,需要对异常进行处理。如可以从初始时序交易数据中筛除异常的子时序交易数据,得到筛除时序交易数据。从初始时序交易数据中筛除异常的子时序交易数据包括清除购买-退货退款类无效类交易、客户多张银行卡相互转账可疑类交易等流水数据,以使得保留下的数据为正常的数据,保证业务正常运行,方法的正常执行。
作为一种可选的实施例,响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,包括:响应于意向指数预测请求,获取目标账户在过去时间段内与目标交易行为相关的初始时序交易数据:从初始时序交易数据中,依据预定时间间隔选取时序交易数据作为时序交易数据。
在该实施例中,说明了从与目标交易行为相关的所有初始时序交易数据中选取时序交易数据作为时序交易数据的步骤。在该实施例中说明了依据预定时间间隔选取时序数据,通过预定时间间隔选取时序数据,可以保证数据一致性,即通过固定的时间间隔,可以确保数据的一致性和可比性。这在进行数据分析和模型训练时非常重要,因为这样可以确保数据在不同时间段或不同数据集之间具有相同的粒度。而且能够保证高效处理,对于大规模的时序数据,按照固定的时间间隔进行选择可以大大减少数据量,从而减少计算和存储的需求。这对于处理实时数据或大规模历史数据集特别有利。还能捕捉周期性变化,很多时序数据都表现出一定的周期性。通过固定的时间间隔,可以更容易地捕捉这些周期性变化,从而更好地理解数据的趋势和模式。再者,能够减少噪声影响:在某些情况下,频繁的数据采样可能会引入更多的噪声。通过增加时间间隔,可以减少噪声的影响,使数据更平滑。而且通过灵活的间隔设置,可以根据实际需求,可以选择不同的时间间隔。例如,对于需要高频数据的应用,可以选择较小的时间间隔;对于不需要那么频繁的数据,可以选择较大的时间间隔,使其更适用于应用与场景。还能简化数据处理,在某些情况下,数据可能不是按时间顺序排列的,或者包含重复值或异常值。通过固定时间间隔选择数据,可以更容易地对数据进行排序、去重或处理其他预处理任务。最终使得模型达到更好的预测性能。
作为一种可选的实施例,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,包括:将时序交易数据输入至与意向预测模型的特征提取模块中,提取时序交易数据的特征,得到多维度的多维度交易特征;将多维度交易特征输入至意向预测模型的特征降维模块中,对多维度交易特征进行降维处理,得到单一维度的单一维度交易特征;将单一维度交易特征输入至意向预测模型中的指数预测模型中,得到意向指数。
在该实施例中,说明了将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数的步骤,在该步骤中,对多维度交易特征进行降维处理,得到单一维度的单一维度交易特征,从而依据单一维度交易特征进行预测,得到意向指数。通过特征的降维处理,单一维度的特征能够将多维度的问题简化为一个维度的问题,使问题的复杂度大大降低,方便进行后续的分析和处理。降低特征的维度可以显著减少需要存储的数据量,这在处理大规模数据集时尤为重要,能够显著提高存储效率和计算效率。在机器学习或数据挖掘的实践中,处理单一维度的数据通常比处理多维数据要快。因此,单一维度的特征可以使相关算法的运行速度更快。通过降维,还可以突出数据中的主要特征,更容易地识别出最重要的影响因素。在某些情况下,使用过多的特征可能会导致过拟合问题。通过降维,可以减少特征的数量,从而降低过拟合的风险。可知,降维处理可以达到至少以上的有益效果。
作为一种可选的实施例,对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果之前,还包括:获取样本时序交易数据与样本属性信息;聚类处理样本时序交易数据,得到P个交易聚类簇,并聚类处理样本属性信息,得到Q个属性聚类簇。
在该实施例中,说明了获取P个交易聚类簇以及Q个属性聚类簇的过程。通过聚类可以将高维数据空间中的样本划分为多个簇,每个簇代表一个类别或模式。通过这种方式,可以方便地处理和可视化数据。而且聚类可以将数据集中的样本划分为多个簇,每个簇中的样本具有相似的特征和属性。通过这种方式,可以简化数据的复杂性,更容易地提取出有用的信息和规律。通过观察每个簇的特征和属性,可以了解数据的分布情况,从而更好地理解数据的内在结构和关系。通过样本聚类出P个交易聚类簇以及Q个属性聚类簇,也有利于本申请所提供方法的实现。
基于上述实施例及可选实施例,提供了一种可选实施方式,下面具体说明。
本发明可选实施方式中提供了一种账户执行交易行为的意向指数预测方法,下面对其进行详细介绍。
S1,接收意向指数预测请求,其中,意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;
S2,响应于意向指数预测请求,获取目标账户在过去时间段内与目标交易行为相关的初始时序交易数据;
S3,在初始时序交易数据中存在M个与目标交易行为相关的行为的情况下,依据与M个行为分别对应的子时序交易数据,确定初始时序交易数据有无异常的异常结果,其中,M为大于1的整数;
S4,在异常结果为初始时序交易数据中存在异常的情况下,从初始时序交易数据中筛除异常的子时序交易数据,得到筛除时序交易数据;
即在上述步骤中,相当于进行了数据预处理的过程,由于在真实业务办理过程中,部分客户在进行银行信贷业务的办理过程中,会存在部分流水造假,以便提升信贷额度或达到准入门槛等需求,故需要先对已有流水明细进行探查、评估、过滤处理,包括清除购买-退货退款类无效类交易、客户多张银行卡相互转账可疑类交易等流水数据。
S5,将筛除时序交易数据按照预定时间间隔选取出时序交易数据。
即上述步骤中,获取存在时序变化的金融特征数据,此类特征在选取过程中,需存在一定的交易频率、时序连贯性、数据可量化等属性,以资金流水、资产变动类等特征为主要衍生目标进行量化分析,且特征数据取数间隔需保持一致。
S6,响应于意向指数预测请求,确定与目标账户对应的账户属性信息;
S7,对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;
S8,依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群;
即分成不同的聚类客群以构建GRU神经单元进行不同维度时域特征处理,由于流水数据对于不同账户属性信息,如不同资金量级的客户在数据反应的呈现存在明细差异,包括交易金额、交易频率、交易极值/均值等。可通过资产划定和同时域交易数据聚类划分,获取相似客户集群。
S9,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,其中,意向预测模型为依据样本数据训练得到的模型,样本数据包括样本账户在过去时间段内与预定交易行为的样本时序交易数据,与样本账户对应的样本意向指数,预定交易行为包括目标交易行为。
即,构建的GRU神经单元,将等时间间隔连续时点数据作为神经元入参,当期待评估时点的意图指数作为目标输出构建模型,通过同类型客群的连续时点金融数据,拟合未来某一时点的预估数据,其中,预估时点不宜距离最后入模时点过长,建议以月为单位在1-2个时间范围内,以天为单位可适当扩充时间范围。
需要说明的是,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数之前,还包括:获取N个初始模型,其中,N个初始模型设置有不同的模型参数,模型参数包括:滑块时域区间,准入滑块数量,N为大于1的整数;依据样本数据对N个初始模型分别进行训练,得到N个目标模型;确定与N个目标模型分别对应的均方误差;从N个目标模型中,确定与最小均方误差对应的模型为意向预测模型。
具体地,可以通过对使用不同时间间隔的时点数据构建的模型进行MSE指标评定,选择指标值最小的模型为最终模型,进而确定模型选择的入模时间间隔参数、入模时间滑块参数;其中,模型的初衷是拆解原时序特征序列中单一金融属性信息,如待预测时点的客户借贷金额、提前还款可能、存续提款概率等,故预测目标为预测时点下客户金融属性时间状态值,可以金额使用区域划分法,如将借贷金额划分A:(0,10000.0]、B:(10000.0,50000.0]、C:(50000.0,100000.0]、D:(100000.0,+∞),即客户借款金额为30000.0元时,划分为B区域等等,以进行更准确地预测。
图2是本发明可选实施方式提供的模型训练步骤的示意图,如图2所示,通过设定不同时间滑块时域区间(金融数据统计最小时间区间)和模型准入滑块数量(具体使用几组金融数据滑块)构建不同准入维度的GRU时序衍生模型,通过对每组GRU时序衍生模型进行MSE(均方误差)指标评估,MSE值越小,表明GRU衍生模型对于目标数值的拟合效果越准确,预测精度越高,故以此确定最优特征衍生模型(即确定时间滑块个数和每个滑块的时间范围)。
通过上述可选实施方式,可以达到至少以下的有益效果:主要针对资金类数据进行时序量化数据处理,处理后的特征较原特征相比,可将多维时序信息降低至一维数据特征,并且新衍生特征完成了趋势信息的数据整合,具有更高的数据质量。作为模型的入参而言,也同样可降低模型的入模特征使用数量,降低构建特征工程的难度。通过引入MSE指标进行最优时域范围选择,衍生时序特征在降低特征使用复杂度的同时,拟合了更多时序信息内容,提升特征数据质量。
而且趋势信息提取整合,GRU循环神经网络可将资金时序变动数据有效整合到预测生成特征中,在原本同一维度下的时点信息预测中增加了纵向时间维度数据信号,提升使用特征的时序信息量。
对多种行为共同表现的数据进行定向金融属性特征提纯,将多时点、多时域压缩的特征进行定向分析预测,衍生特征可最大程度降低由于其他客户行为带来的噪声影响,提升数据质量。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本发明并不受所描述的动作顺序的限制,因为依据本发明,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本发明所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例的方法。
根据本发明实施例,还提供了一种用于实施上述账户执行交易行为的意向指数预测方法的装置,图3是根据本申请实施例提供的账户执行交易行为的意向指数预测装置的结构框图,如图3所示,该装置包括:接收模块302,第一确定模块304,聚类模块306,第二确定模块308和预测模块310,下面对该装置进行详细说明。
接收模块302,用于接收意向指数预测请求,其中,意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;第一确定模块304,连接于上述接收模块302,用于响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,并确定与目标账户对应的账户属性信息;聚类模块306,连接于上述第一确定模块304,用于对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;第二确定模块308,连接于上述聚类模块306,用于依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群;预测模块310,连接于上述第二确定模块308,用于将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,其中,意向预测模型为依据样本数据训练得到的模型,样本数据包括样本账户在过去时间段内与预定交易行为的样本时序交易数据,与样本账户对应的样本意向指数,预定交易行为包括目标交易行为。
此处需要说明的是,上述接收模块302,第一确定模块304,聚类模块306,第二确定模块308和预测模块310对应于实施账户执行交易行为的意向指数预测方法中的步骤S101至步骤S110,多个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例所公开的内容。
本申请实施例提供的账户执行交易行为的意向指数预测装置,接收意向指数预测请求,意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数。响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,并确定与目标账户对应的账户属性信息。对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果。依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群。将时序交易数据输入至与聚类客群对应的意向预测模型中,达到得到意向指数的目的。由于先对目标账户的时序交易数据,以及账户属性信息分别进行了聚类处理,确定出了目标账户在交易数据上所属的类别,以及目标账户在属性信息上所属的类别,判断出目标账户所属的聚类客群。进而,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数。由于意向预测模型是与聚类客群所对应的模型,因此,达到了更具针对性、准确地预测。进而解决了相关技术中难以准确预测目标账户执行交易行为的意向指数的技术问题。
所述账户执行交易行为的意向指数预测装置包括处理器和存储器,上述多个模块等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数解决了相关技术中难以准确预测目标账户执行交易行为的意向指数的技术问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现账户执行交易行为的意向指数预测方法。
本发明实施例提供了一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行账户执行交易行为的意向指数预测方法。
图4是本发明实施例提供的电子设备的示意图,如图4所示,本发明实施例提供了一种电子设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:根据本发明实施例的一个方面,提供了一种账户执行交易行为的意向指数预测方法,包括:接收意向指数预测请求,其中,意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,并确定与目标账户对应的账户属性信息;对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群;将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,其中,意向预测模型为依据样本数据训练得到的模型,样本数据包括样本账户在过去时间段内与预定交易行为的样本时序交易数据,与样本账户对应的样本意向指数,预定交易行为包括目标交易行为。
可选地,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数之前,还包括:获取N个初始模型,其中,N个初始模型设置有不同的模型参数,模型参数包括:滑块时域区间,准入滑块数量,N为大于1的整数;依据样本数据对N个初始模型分别进行训练,得到N个目标模型;确定与N个目标模型分别对应的均方误差;从N个目标模型中,确定与最小均方误差对应的模型为意向预测模型。
可选地,响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,包括:响应于意向指数预测请求,获取目标账户在过去时间段内与目标交易行为相关的初始时序交易数据;在初始时序交易数据中存在M个与目标交易行为相关的行为的情况下,依据与M个行为分别对应的子时序交易数据,确定初始时序交易数据有无异常的异常结果,其中,M为大于1的整数;在异常结果为初始时序交易数据无异常的情况下,将初始时序交易数据作为时序交易数据。
可选地,依据与M个行为分别对应的子时序交易数据,确定初始时序交易数据有无异常的异常结果之后,还包括:在异常结果为初始时序交易数据中存在异常的情况下,从初始时序交易数据中筛除异常的子时序交易数据,得到筛除时序交易数据;将筛除时序交易数据作为时序交易数据。
可选地,响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,包括:响应于意向指数预测请求,获取目标账户在过去时间段内与目标交易行为相关的初始时序交易数据:从初始时序交易数据中,依据预定时间间隔选取时序交易数据作为时序交易数据。
可选地,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,包括:将时序交易数据输入至与意向预测模型的特征提取模块中,提取时序交易数据的特征,得到多维度的多维度交易特征;将多维度交易特征输入至意向预测模型的特征降维模块中,对多维度交易特征进行降维处理,得到单一维度的单一维度交易特征;将单一维度交易特征输入至意向预测模型中的指数预测模型中,得到意向指数。
可选地,对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果之前,还包括:获取样本时序交易数据与样本属性信息;聚类处理样本时序交易数据,得到P个交易聚类簇,并聚类处理样本属性信息,得到Q个属性聚类簇。
本文中的设备可以是服务器、PC、PAD、手机等。
本申请还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:根据本发明实施例的一个方面,提供了一种账户执行交易行为的意向指数预测方法,包括:接收意向指数预测请求,其中,意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,并确定与目标账户对应的账户属性信息;对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;依据第一聚类结果与第二聚类结果,确定目标账户对应的聚类客群;将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,其中,意向预测模型为依据样本数据训练得到的模型,样本数据包括样本账户在过去时间段内与预定交易行为的样本时序交易数据,与样本账户对应的样本意向指数,预定交易行为包括目标交易行为。
可选地,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数之前,还包括:获取N个初始模型,其中,N个初始模型设置有不同的模型参数,模型参数包括:滑块时域区间,准入滑块数量,N为大于1的整数;依据样本数据对N个初始模型分别进行训练,得到N个目标模型;确定与N个目标模型分别对应的均方误差;从N个目标模型中,确定与最小均方误差对应的模型为意向预测模型。
可选地,响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,包括:响应于意向指数预测请求,获取目标账户在过去时间段内与目标交易行为相关的初始时序交易数据;在初始时序交易数据中存在M个与目标交易行为相关的行为的情况下,依据与M个行为分别对应的子时序交易数据,确定初始时序交易数据有无异常的异常结果,其中,M为大于1的整数;在异常结果为初始时序交易数据无异常的情况下,将初始时序交易数据作为时序交易数据。
可选地,依据与M个行为分别对应的子时序交易数据,确定初始时序交易数据有无异常的异常结果之后,还包括:在异常结果为初始时序交易数据中存在异常的情况下,从初始时序交易数据中筛除异常的子时序交易数据,得到筛除时序交易数据;将筛除时序交易数据作为时序交易数据。
可选地,响应于意向指数预测请求,确定目标账户在当前时间之前的过去时间段内与目标交易行为相关的时序交易数据,包括:响应于意向指数预测请求,获取目标账户在过去时间段内与目标交易行为相关的初始时序交易数据:从初始时序交易数据中,依据预定时间间隔选取时序交易数据作为时序交易数据。
可选地,将时序交易数据输入至与聚类客群对应的意向预测模型中,得到意向指数,包括:将时序交易数据输入至与意向预测模型的特征提取模块中,提取时序交易数据的特征,得到多维度的多维度交易特征;将多维度交易特征输入至意向预测模型的特征降维模块中,对多维度交易特征进行降维处理,得到单一维度的单一维度交易特征;将单一维度交易特征输入至意向预测模型中的指数预测模型中,得到意向指数。
可选地,对时序交易数据进行聚类处理,得到时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对账户属性信息进行聚类处理,得到账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果之前,还包括:获取样本时序交易数据与样本属性信息;聚类处理样本时序交易数据,得到P个交易聚类簇,并聚类处理样本属性信息,得到Q个属性聚类簇。
本领域内的技术人员应明白,本申请的实施例可提供为方法、系统、或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本申请的实施例可提供为方法、系统或计算机程序产品。因此,本申请可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本申请可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本申请的实施例而已,并不用于限制本申请。对于本领域技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本申请的权利要求范围之内。
Claims (10)
1.一种账户执行交易行为的意向指数预测方法,其特征在于,包括:
接收意向指数预测请求,其中,所述意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;
响应于所述意向指数预测请求,确定所述目标账户在所述当前时间之前的过去时间段内与所述目标交易行为相关的时序交易数据,并确定与所述目标账户对应的账户属性信息;
对所述时序交易数据进行聚类处理,得到所述时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对所述账户属性信息进行聚类处理,得到所述账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;
依据所述第一聚类结果与所述第二聚类结果,确定所述目标账户对应的聚类客群;
将所述时序交易数据输入至与所述聚类客群对应的意向预测模型中,得到意向指数,其中,所述意向预测模型为依据样本数据训练得到的模型,所述样本数据包括样本账户在所述过去时间段内与预定交易行为的样本时序交易数据,与所述样本账户对应的样本意向指数,所述预定交易行为包括所述目标交易行为。
2.根据权利要求1所述的方法,其特征在于,所述将所述时序交易数据输入至与所述聚类客群对应的意向预测模型中,得到意向指数之前,还包括:
获取N个初始模型,其中,所述N个初始模型设置有不同的模型参数,所述模型参数包括:滑块时域区间,准入滑块数量,N为大于1的整数;
依据所述样本数据对所述N个初始模型分别进行训练,得到N个目标模型;
确定与所述N个目标模型分别对应的均方误差;
从所述N个目标模型中,确定与最小均方误差对应的模型为所述意向预测模型。
3.根据权利要求1所述的方法,其特征在于,所述响应于所述意向指数预测请求,确定所述目标账户在所述当前时间之前的过去时间段内与所述目标交易行为相关的时序交易数据,包括:
响应于所述意向指数预测请求,获取所述目标账户在过去时间段内与所述目标交易行为相关的初始时序交易数据;
在所述初始时序交易数据中存在M个与所述目标交易行为相关的行为的情况下,依据与M个行为分别对应的子时序交易数据,确定所述初始时序交易数据有无异常的异常结果,其中,M为大于1的整数;
在所述异常结果为所述初始时序交易数据无异常的情况下,将所述初始时序交易数据作为所述时序交易数据。
4.根据权利要求3所述的方法,其特征在于,所述依据与M个行为分别对应的子时序交易数据,确定所述初始时序交易数据有无异常的异常结果之后,还包括:
在所述异常结果为所述初始时序交易数据中存在异常的情况下,从所述初始时序交易数据中筛除异常的子时序交易数据,得到筛除时序交易数据;
将所述筛除时序交易数据作为所述时序交易数据。
5.根据权利要求1所述的方法,其特征在于,所述响应于所述意向指数预测请求,确定所述目标账户在所述当前时间之前的过去时间段内与所述目标交易行为相关的时序交易数据,包括:
响应于所述意向指数预测请求,获取所述目标账户在过去时间段内与所述目标交易行为相关的初始时序交易数据:
从所述初始时序交易数据中,依据预定时间间隔选取时序交易数据作为所述时序交易数据。
6.根据权利要求1所述的方法,其特征在于,所述将所述时序交易数据输入至与所述聚类客群对应的意向预测模型中,得到意向指数,包括:
将所述时序交易数据输入至与所述意向预测模型的特征提取模块中,提取所述时序交易数据的特征,得到多维度的多维度交易特征;
将所述多维度交易特征输入至所述意向预测模型的特征降维模块中,对所述多维度交易特征进行降维处理,得到单一维度的单一维度交易特征;
将所述单一维度交易特征输入至所述意向预测模型中的指数预测模型中,得到所述意向指数。
7.根据权利要求1至6中任意一项所述的方法,其特征在于,所述对所述时序交易数据进行聚类处理,得到所述时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对所述账户属性信息进行聚类处理,得到所述账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果之前,还包括:
获取样本时序交易数据与样本属性信息;
聚类处理所述样本时序交易数据,得到所述P个交易聚类簇,并聚类处理所述样本属性信息,得到所述Q个属性聚类簇。
8.一种账户执行交易行为的意向指数预测装置,其特征在于,包括:
接收模块,用于接收意向指数预测请求,其中,所述意向指数预测请求用于预测目标账户在当前时间之后的未来时间段内,执行目标交易行为的意向指数;
第一确定模块,用于响应于所述意向指数预测请求,确定所述目标账户在所述当前时间之前的过去时间段内与所述目标交易行为相关的时序交易数据,并确定与所述目标账户对应的账户属性信息;
聚类模块,用于对所述时序交易数据进行聚类处理,得到所述时序交易数据属于P个交易聚类簇中目标交易簇的第一聚类结果,并对所述账户属性信息进行聚类处理,得到所述账户属性信息属于Q个属性聚类簇中目标属性簇的第二聚类结果,其中,P为大于1的整数,Q为大于1的整数;
第二确定模块,用于依据所述第一聚类结果与所述第二聚类结果,确定所述目标账户对应的聚类客群;
预测模块,用于将所述时序交易数据输入至与所述聚类客群对应的意向预测模型中,得到意向指数,其中,所述意向预测模型为依据样本数据训练得到的模型,所述样本数据包括样本账户在所述过去时间段内与预定交易行为的样本时序交易数据,与所述样本账户对应的样本意向指数,所述预定交易行为包括所述目标交易行为。
9.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至7中任意一项所述的方法。
10.一种电子设备,其特征在于,包括一个或多个处理器和存储器,所述存储器用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现权利要求1至7中任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311873266.2A CN117829362A (zh) | 2023-12-29 | 2023-12-29 | 账户执行交易行为的意向指数预测方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202311873266.2A CN117829362A (zh) | 2023-12-29 | 2023-12-29 | 账户执行交易行为的意向指数预测方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117829362A true CN117829362A (zh) | 2024-04-05 |
Family
ID=90516882
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202311873266.2A Pending CN117829362A (zh) | 2023-12-29 | 2023-12-29 | 账户执行交易行为的意向指数预测方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117829362A (zh) |
-
2023
- 2023-12-29 CN CN202311873266.2A patent/CN117829362A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Wirawan et al. | Short term prediction on bitcoin price using ARIMA method | |
US20230325724A1 (en) | Updating attribute data structures to indicate trends in attribute data provided to automated modelling systems | |
CN110400021B (zh) | 银行网点现金用量预测方法及装置 | |
Yoon et al. | Semi-supervised learning with deep generative models for asset failure prediction | |
Dordonnat et al. | Dynamic factors in periodic time-varying regressions with an application to hourly electricity load modelling | |
Oprea et al. | Machine learning classification algorithms and anomaly detection in conventional meters and Tunisian electricity consumption large datasets | |
KR20200039852A (ko) | 기업 경영 현황 분석 예측 모델링을 위한 기계학습 알고리즘 제공 방법 | |
CN114612239A (zh) | 基于算法、大数据、人工智能的股票舆情监测和风控系统 | |
Asad et al. | A long-short-term-memory based model for predicting atm replenishment amount | |
Wang et al. | Forecasting open-high-low-close data contained in candlestick chart | |
CN116800831B (zh) | 一种业务数据推送方法、装置、存储介质及处理器 | |
Riofrio et al. | Forecasting the Consumer Price Index of Ecuador using Classical and Advanced Time Series Models | |
Sun | Intelligent data mining based on market circulation of production factors | |
CN112598526A (zh) | 资产数据的处理方法及装置 | |
Prime | Forecasting the changes in daily stock prices in Shanghai stock exchange using neural network and ordinary Least Squares regression | |
CN110910241A (zh) | 现金流评估方法、装置、服务器设备及存储介质 | |
CN117273737A (zh) | 一种信用卡欺诈监控方法与系统 | |
CN117829362A (zh) | 账户执行交易行为的意向指数预测方法及装置 | |
Shen et al. | Bitcoin Return Volatility Forecasting: A Comparative Study of GARCH Model and Machine Learning Model | |
De Rosa et al. | Practical forecasting of cryptocoins timeseries using correlation patterns | |
Yu | Economic and Financial Data Analysis System Based on Deep Learning and Neural Network Algorithm | |
CN112308295B (zh) | 违约概率预测方法及装置 | |
Qiao et al. | Singular spectrum analysis based long short-term memory for predicting bitcoin price | |
Yamak et al. | Leveraging ResNet CNN and XGBoost for Enhanced Bitcoin Price Forecasting | |
Vanitha et al. | Machine Learning and Artificial Neural Network Process–Viability and Implications in Stock Market Prediction |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |