CN114219184A - 产品交易数据预测方法、装置、设备、介质和程序产品 - Google Patents

产品交易数据预测方法、装置、设备、介质和程序产品 Download PDF

Info

Publication number
CN114219184A
CN114219184A CN202210079567.7A CN202210079567A CN114219184A CN 114219184 A CN114219184 A CN 114219184A CN 202210079567 A CN202210079567 A CN 202210079567A CN 114219184 A CN114219184 A CN 114219184A
Authority
CN
China
Prior art keywords
information
product
initial
sample
different types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202210079567.7A
Other languages
English (en)
Inventor
陈李龙
徐林嘉
王娜
倪俊
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202210079567.7A priority Critical patent/CN114219184A/zh
Publication of CN114219184A publication Critical patent/CN114219184A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/044Recurrent networks, e.g. Hopfield networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Abstract

本申请涉及一种产品交易数据预测方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:获取待预测产品的目标信息,所述目标信息包括不同类型的初始信息;对所述不同类型的初始信息进行处理得到模型输入信息,所述模型输入信息包括不同类型的产品信息以及不同类型的产品关系;将所述模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;所述交易数据预测模型是在最大化所述不同类型的产品信息之间的相关性的前提下训练得到的。采用本方法能够应用多种信息对待预测产品进行预测。

Description

产品交易数据预测方法、装置、设备、介质和程序产品
技术领域
本申请涉及人工智能技术领域,特别是涉及一种产品交易数据预测方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术
随着人工智能技术的发展,出现了基于机器学习技术对用户的理财行为进行预测的技术,以为用户提供个性化的推荐信息,减少用户的交易成本。
为了更准确的对用户的交易行为进行预测,需要获取待预测用户对应的理财产品的交易量、交易价格等信息。现有的针对待预测用户的理财行为进行预测的技术仅应用了交易量信息或交易价格信息等信息中的一种,导致了预测结果不佳。
发明内容
基于此,有必要针对上述技术问题,提供一种能够应用多种信息对待预测产品进行预测的产品交易数据预测方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
第一方面,本申请提供了一种产品交易数据预测方法,所述方法包括:
获取待预测产品的目标信息,所述目标信息包括不同类型的初始信息;
对所述不同类型的初始信息进行处理得到模型输入信息,所述模型输入信息包括不同类型的产品信息以及不同类型的产品关系;
将所述模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;所述交易数据预测模型是在最大化所述不同类型的产品信息之间的相关性的前提下训练得到的。
在其中一个实施例中,所述获取待预测产品的目标信息,包括:
获取各个产品的历史信息;根据所述历史信息计算各个产品之间的相关性;
根据所述相关性以及各个所述产品的历史信息生成第一类初始信息图;
从所述第一类初始信息图中提取所述待预测产品的第一类初始信息。
在其中一个实施例中,所述获取待预测产品的目标信息,包括:
获取各目标产品的真实信息;
根据所述真实信息生成对应的第二类初始信息图;
从所述第二类初始信息图中提取所述待预测产品的第二类初始信息。
在其中一个实施例中,所述对所述不同类型的产品信息进行处理得到模型输入信息,包括:
将所述不同类型的初始信息进行处理得到不同类型的产品信息图;
根据预先训练得到的模型对所述不同类型的产品信息图进行处理得到所述待预测产品对应的模型输入信息。
在其中一个实施例中,所述初始信息包括新闻信息,所述将所述不同类型的初始信息进行处理得到不同类型的产品信息图,包括以下至少一个:
将所述第一类初始信息与所述第二类初始信息通过第一模型进行信息聚合得到第一类关系图,并将所述第一类关系图通过提取时间信息的第二模型进行序列信息建模得到对应的第一类产品信息图;和/或
将所述新闻信息通过提取时间信息的第三模型进行信息提取得到第二类产品信息图。
在其中一个实施例中,所述交易数据预测模型的训练过程包括:
获取待训练产品的样本信息,所述样本信息包括不同类型的初始样本信息;
对所述不同类型的初始样本信息进行处理得到初始模型输入信息,所述初始模型输入信息包括不同类型的样本产品信息以及不同类型的样本产品关系;
将所述初始模型输入信息输入初始交易数据预测模型中,得到样本预测时间的样本预测交易数据;
根据正则化项和所述样本预测交易数据形成目标函数,通过所述目标函数对所述初始交易数据预测模型进行优化得到所述交易数据预测模型;所述正则化项根据所述初始模型输入信息生成,用于最大化所述不同类型的样本产品信息之间的相关性。
在其中一个实施例中,所述获取待训练产品的样本信息,包括:
获取各个训练产品的历史样本信息;根据所述历史样本信息计算各个所述训练产品之间的历史相关性;
根据所述历史相关性以及各个所述训练产品的历史样本信息生成第一类初始样本信息图;
从所述第一类初始样本信息图中提取所述待训练产品的第一类初始样本信息。
在其中一个实施例中,所述获取待训练产品的样本信息,包括:
获取各目标样本产品的真实样本信息;
根据所述真实样本信息生成对应的第二类初始样本信息图;
从所述第二类初始样本信息图中提取所述待训练产品的第二类初始样本信息。
在其中一个实施例中,所述对所述不同类型的初始样本信息进行处理得到初始模型输入信息,包括:
将所述不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;
根据预先训练得到的所述模型对所述不同类型的产品样本信息图进行处理得到所述待训练产品对应的初始模型输入信息。
在其中一个实施例中,所述初始样本信息包括新闻样本信息,所述将所述不同类型的初始样本信息进行处理得到不同类型的产品样本信息图,包括以下至少一个:
将所述第一类初始样本信息与所述第二类初始样本信息通过所述第一模型进行信息聚合得到第一类样本关系图,并将所述第一类样本关系图通过所述第二模型进行序列信息建模得到对应的第一类产品样本信息图;和/或
将所述新闻样本信息通过所述第三模型进行信息提取得到第二类产品样本信息图。
第二方面,本申请还提供了一种产品交易预测装置,所述装置包括:
信息获取模块,用于获取待预测产品的目标信息,所述目标信息包括不同类型的初始信息;
信息处理模块,用于对所述不同类型的初始信息进行处理得到模型输入信息,所述模型输入信息包括不同类型的产品信息以及不同类型的产品关系;
预测模块,用于将所述模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;所述交易数据预测模型是在最大化所述不同类型的产品信息之间的相关性的前提下训练得到的。
第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现上述的方法的步骤。
第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以上述的方法的步骤。
上述产品交易数据预测方法、装置、计算机设备、存储介质和计算机程序产品,终端获取待预测产品的目标信息,目标信息包括不同类型的初始信息;对不同类型的初始信息进行处理得到模型输入信息,模型输入信息包括不同类型的产品信息以及不同类型的产品关系;将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据。通过待预测产品的不同类型的产品信息以及不同类型的产品关系得到预测时间的预测交易数据的过程中,利用了待预测产品不同维度的信息,使得预测结果更准确。由于交易数据预测模型是在最大化不同类型的产品信息之间的相关性的前提下训练得到的,即通过训练使得模型输入信息中不同类型的产品信息在模型中相互优化,进而通过待预测产品的不同类型的产品信息的共同作用对待预测产品的交易数据进行预测,使得预测结果更准确。其中,最大化不同类型的产品信息之间的相关性的交易数据预测模型,可以将基于待预测产品的模型输入信息中不同类型的产品信息的预测结果之间的差异减小,就可以使得基于待预测产品的模型输入信息中不同类型的产品信息的预测结果之间的相似性最大,进而使得构成模型输入信息中的不同类型的产品信息在模型的学习过程中相互优化,以实现对待预测产品的交易数据的预测。
附图说明
图1为一个实施例中产品交易数据预测方法的应用环境图;
图2为一个实施例中产品交易数据预测方法的流程示意图;
图3为另一个实施例中产品交易数据预测方法的流程示意图;
图4为一个实施例中产品交易数据预测装置的结构框图;
图5为一个实施例中计算机设备的内部结构图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例提供的产品交易数据预测方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。终端102获取待预测产品的目标信息,目标信息包括不同类型的初始信息;对不同类型的初始信息进行处理得到模型输入信息,模型输入信息包括不同类型的产品信息以及不同类型的产品关系;将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;交易数据预测模型是在最大化不同类型的产品信息之间的相关性的前提下训练得到的。服务器104用于获取和/或存储终端102获取的待预测产品的目标信息。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
在一个实施例中,如图2所示,提供了一种产品交易数据预测方法,以该方法应用于图1中的终端102为例进行说明,包括以下步骤:
步骤202,获取待预测产品的目标信息,目标信息包括不同类型的初始信息。
其中,待预测产品为用户持有的产品中的一个或多个。产品可以为基金、股票、债券、期货、黄金等理财产品,本申请并不对理财产品的种类进行限定,只要满足理财产品的份数可以通过用户的操作进行买进或卖出即可。本实施例后续以产品为基金进行说明,若产品为股票或债券等其它理财产品时,原理相同,将不再赘述。
目标信息为与待预测产品相应的信息,目标信息包括待预测产品在不同维度下所提取的相应信息。在一个维度下所提取的待预测产品的信息对应一个类型的初始信息,由于提取信息的维度的多样性,因此会产生不同类型的初始信息。初始信息为待预测产品在某一维度下所提取的具体信息。这些不同类型的初始消息包括但不限于净值相关性、成交量相关性、价格数据、数量数据以及新闻信息。其中,待预测产品的净值相关性为基于待预测产品在目标时长内每个交易日的净值信息以及与各产品之间的统计相关性获得。待预测产品的成交量相关性为基于待预测产品在目标时长内每个交易日的成交量相关性信息以及与各产品之间的统计相关性获得。目标时长为5年,本实施例并不对目标时长做具体限定,根据预测需求可对目标时长进行更改。价格数据为用户在预设时长内每个交易日内所购买的待预测产品的交易价格。数量数据为用户在预设时长内每个交易日内所购买的待预测产品的交易数量。优选地,获取待预测产品预设时长的价格数据和数量数据。优选地,预设时长为30天,本实施例并不对预设时长做具体限定,根据预测需求可对预设时长进行更改。新闻信息为预测时间的前一日到预测时间开盘前的待预测产品相关的新闻信息。以上对于时间的限定都是举例说明,在其他的实施例中可以选择其他的时间限定,本申请并不对时间进行限制。
具体地,终端获取待预测产品的目标信息,目标信息包括但不限于待预测产品的净值相关性、成交量相关性、价格数据、数量数据以及新闻信息。优选地,待预测产品的净值性和成交量相关性根据各产品在目标时长内的历史净值信息和历史成交量信息得到,其中,上述各产品包括待预测产品。
步骤204,对不同类型的初始信息进行处理得到模型输入信息,模型输入信息包括不同类型的产品信息以及不同类型的产品关系。
模型输入信息是指待预测产品的不同类型的产品信息以及不同类型的产品关系,其中不同类型的产品信息是指交易量时间序列信息、交易价格时间序列信息和突发新闻编码信息。产品关系的类型是指净值相关性和成交量相关性。
具体地,终端对待预测产品的净值相关性、成交量相关性、价格数据进行处理得到对应的交易价格时间序列信息;对待预测产品的净值相关性、成交量相关性、数量数据进行处理得到对应的交易量时间序列信息;对待预测产品的新闻信息进行处理得到对应的突发新闻编码信息。终端将待预测产品的净值相关性、成交量相关性处理为两种相关关系,这两种相关关系分别是净值相关性和成交量相关性。终端将上述待预测产品的不同类型的产品信息和不同类型的产品关系作为模型的输入信息,不同类型的产品信息包括待预测产品的交易量时间序列信息、交易价格时间序列信息和突发新闻编码信息,不同类型的产品关系包括待预测产品的净值相关性和成交量相关性。
步骤206,将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;交易数据预测模型是在最大化不同类型的产品信息之间的相关性的前提下训练得到的。
其中,预测时间为下一个交易日或者是其他的时间,预测交易数据为针对用户对待预测产品的交易操作的预测,上述交易操作包括买入或卖出。交易数据预测模型是通过目标函数进行调整得到,目标函数中的正则化项则用于最大化不同类型的产品信息之间的相关性。其中目标函数是初始交易数据预测模型训练时的损失函数,该损失函数包括经验损失项和正则化项,经验损失项为初始交易预测模型的输出与对应标签之间的差值,正则化项用于最大化待预测产品的不同类型的产品信息之间的相关性,这样使得模型充分考虑了待预测产品的不同类型的产品信息之间的相关性,通过各个类型的产品信息联合优化,提高了准确性。
具体地,终端将模型输入信息即待预测产品的交易量时间序列信息、交易价格时间序列信息和突发新闻编码信息以及净值相关性和成交量相关性输入至交易数据预测模型中,得到下一交易日用户针对待预测产品的操作的预测,具体地,终端先根据交易量时间序列信息、交易价格时间序列信息和突发新闻编码信息以及净值相关性和成交量相关性生成输入向量,并将输入向量输入至初始交易预测模型得到交易预测模型。。
上述产品交易数据预测方法中,终端获取待预测产品的目标信息,目标信息包括不同类型的初始信息;对不同类型的初始信息进行处理得到模型输入信息,模型输入信息包括不同类型的产品信息以及不同类型的产品关系;将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据。通过待预测产品的不同类型的产品信息以及不同类型的产品关系得到预测时间的预测交易数据的过程中,利用了待预测产品不同维度的信息,使得预测结果更准确。由于交易数据预测模型是在最大化不同类型的产品信息之间的相关性的前提下训练得到的,即通过训练使得模型输入信息中不同类型的产品信息在模型中相互优化,进而通过待预测产品的不同类型的产品信息的共同作用对待预测产品的交易数据进行预测,使得预测结果更准确。其中,最大化不同类型的产品信息之间的相关性的交易数据预测模型,可以将基于待预测产品的模型输入信息中不同类型的产品信息的预测结果之间的差异减小,就可以使得基于待预测产品的模型输入信息中不同类型的产品信息的预测结果之间的相似性最大,进而使得构成模型输入信息中的不同类型的产品信息在模型的学习过程中相互优化,以实现对待预测产品的交易数据的预测。
在一个实施例中,获取待预测产品的目标信息,包括:获取各个产品的历史信息;根据历史信息计算各个产品之间的相关性;根据相关性以及各个产品的历史信息生成第一类初始信息图;从第一类初始信息图中提取待预测产品的第一类初始信息。
其中,历史信息为市场上所有基金在目标时长内的历史净值信息、历史成交量信息。
具体地,终端获取市场上所有基金即各个训练产品在目标时长内的历史净值信息和历史成交量信息。根据不同基金的历史净值信息和历史成交量信息构建一个基金关系图即第一类初始信息图。在第一类初始信息图中,每个节点代表一只基金,节点之间根据由两个相关矩阵连接,这两个相关矩阵分别根据目标时长内的基金的净值变化和成交量情况以及各基金之间的统计相关性(例如,PearsonRank)获得的。基金关系图中的两个相关矩阵即基金关系图中的两种边关,分别为净值相关性和成交量相关性,边上的正值表示正相关,负值表示负相关。终端从基金关系图中提取待训练产品的净值变化趋势相关性和成交量变化趋势相关性,其中,待训练产品的净值变化趋势相关性和成交量变化趋势相关性即为第一类初始信息。
本实施例中,通过各产品的历史信息可以得到待预测产品的第一类初始信息,以获取待预测产品的长期属性,并作为目标用户历史产品交易行为的调节和补充,降低历史交易行为中存在的随机性的影响,提高交易数据预测模型对待预测产品的交易行为的预测准确性提供了基础。其中,目标用户为待预测产品的持有者。
在一个实施例中,获取待预测产品的目标信息,包括:获取各目标产品的真实信息;根据真实信息生成对应的第二类初始信息图;从第二类初始信息图中提取待预测产品的第二类初始信息。
其中,目标产品为目标用户持有的产品。若产品为基金,则目标产品为用户持有的基金。真实信息为目标用户在预设时长内的对各目标产品进行操作所产生的交易数据,其中,交易数据包括各目标产品在预设时长内的交易价格数据和交易量数据。
具体地,终端获取目标用户所持有的产品在预设时长内的交易价格数据和交易量数据,并将上述交易价格数据和交易量数据分别处理为价格图和交易量图。其中,价格图中的节点信息为目标用户所持有的产品在一个交易日的价格信息,交易量图中节点信息为目标用户所持有的产品在一个交易日的有效交易量信息,以及在预设时长中交易总量的占比。价格图和交易量图即为第二类初始信息图。终端从给第二类初始信息图中获取待预测产品的价格信息、有效交易量信息,以及有效交易量在预设时长中交易总量的占比,并将上述获取信息作为第二类初始信息。
本实施例中,终端通过各目标产品的真实信息提取待预测产品的第二类初始信息,即获取了待预测产品的短期信息,以对待预测产品的交易行为进行预测,增强预测的准确性。
在一个实施例中,对不同类型的产品信息进行处理得到模型输入信息,包括:将不同类型的初始信息进行处理得到不同类型的产品信息图;根据预先训练得到的模型对不同类型的产品信息图进行处理得到待预测产品对应的模型输入信息。
具体地,终端对第一类初始信息和第二类初始信息进行处理得到第一种类型的产品信息图。终端对第三类初始信息即新闻信息进行处理得到第二种类型的产品信息图。终端通过预先训练得到的模型对不同类型的产品信息图进行处理得到对应类型的产品信息以及产品关系以作为待预测产品对应的模型输入信息。
本实施例中,将不同类型的初始信息进行处理得到不同类型的产品信息图;根据预先训练得到的模型对不同类型的产品信息图进行处理得到待预测产品对应的模型输入信息,以为交易数据预测模型提供预测数据。
在一个实施例中,将不同类型的初始信息进行处理得到不同类型的产品信息图,包括以下至少一个:将第一类初始信息与第二类初始信息通过第一模型进行信息聚合得到第一类关系图,并将第一类关系图通过提取时间信息的第二模型进行序列信息建模得到对应的第一类产品信息图;和/或将新闻信息通过提取时间信息的第三模型进行信息提取得到第二类产品信息图。
其中,第一模型为预先训练好的GCN模型,第二模型为预先训练好的LSTM模型,第三模型为另一预先训练好的LSTM模型。
具体地,终端将第一类初始信息即待预测产品的净值变化趋势相关性、成交量变化趋势相关性以及第二类初始信息中待预测产品的价格信息,通过预先训练好的GCN模型进行相邻信息的聚合得到对应的第一类关系图,并将对应的第一类关系图按照待预测产品的价格信息中的时间数列进行LSTM建模,以得到交易量时间序列信息图即第一类产品信息图中的一个。终端将第一类初始信息即待预测产品的净值变化趋势相关性和成交量变化趋势相关性以及第二类初始信息即待预测产品的有效交易量信息、有效交易量在预设时长中交易总量的占比,通过预先训练好的GCN模型进行相邻信息的聚合得到对应的第一类关系图,并将对应的第一类关系图按照待预测产品的有效交易量信息、有效交易量在预设时长中交易总量的占比中的时间数列进行LSTM建模,以得到交易价格时间序列信息图即第一类产品信息图中的另一个。终端将新闻信息通过提取时间信息的第三LSTM模型进行信息提取得到第二类产品信息图。
在本实施例中,通过将不同类型的初始信息进行处理得到不同类型的产品信息图,以得到模型输入信息。
在一个实施例中,交易数据预测模型的训练过程包括:获取待训练产品的样本信息,样本信息包括不同类型的初始样本信息。
其中,待训练产品为训练与交易数据预测模型相对应的初始交易数据预测模型的样本产品。其中,待训练产品为与待预测产品种类相同的理财产品。样本信息与待训练产品之间的关系与目标产品与待预测产品之间的关系相同。样本信息为待训练产品在不同维度下所提取的相应信息的和。在不同维度下所提取的待训练产品的信息对应不同类型的初始样本信息。初始样本信息为待训练产品在某一维度下所提取的具体信息。这些不同类型的初始样本消息包括但不限于净值相关性、成交量相关性、价格数据、数量数据以及新闻信息。其中,净值相关性、成交量相关性、价格数据、数量数据以及新闻信息所代表的含义与上述实施例的相同,在本实施例中净值相关性、成交量相关性、价格数据、数量数据以及新闻信息为待训练样品对应的内容。
具体地,终端获取待训练产品的样本信息,样本信息包括但不限于待训练产品的净值相关性、成交量相关性、价格数据、数量数据以及新闻信息。优选地,待训练产品的净值性和成交量相关性根据包括待训练产品的各产品的目标时长内的历史样本净值信息和历史样本成交量信息得到。
对不同类型的初始样本信息进行处理得到初始模型输入信息,初始模型输入信息包括不同类型的样本产品信息以及不同类型的样本产品关系。
具体地,对不同类型的初始样本信息进行处理得到初始模型输入信息的步骤实现方法与上述实施例中对不同类型的初始信息进行处理得到模型输入信息的方法相同,在此不再赘述。
将初始模型输入信息输入初始交易数据预测模型中,得到样本预测时间的样本预测交易数据。
具体地,将初始模型输入信息输入初始交易数据预测模型中,得到样本预测时间的样本预测交易数据的步骤与上述实施例中将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据的方法相同,在此不再赘述。
根据正则化项和样本预测交易数据形成目标函数,通过目标函数对初始交易数据预测模型进行优化得到交易数据预测模型。正则化项根据初始模型输入信息生成,用于最大化不同类型的样本产品信息之间的相关性。
具体地,根据待训练产品的标签与待训练产品的预测交易数据得到目标函数,目标函数中包括正则化项,正则化项根据初始模型输入信息即包括但不限于净值相关性、成交量相关性、价格数据、数量数据以及新闻信息生成,用于最大化不同类型的样本产品信息之间的相关性。终端通过目标函数对初始交易数据预测模型进行优化得到交易数据预测模型。
在本实施例中,通过根据正则化项和样本预测交易数据形成目标函数,通过目标函数对初始交易数据预测模型进行优化得到交易数据预测模型;正则化项根据初始模型输入信息生成,可以将基于待预测产品的模型输入信息中不同类型的产品信息的预测结果之间的差异减小,就可以使得基于待预测产品的模型输入信息中不同类型的产品信息的预测结果之间的相似性最大,进而使得构成模型输入信息中的不同类型的产品信息在模型的学习过程中相互优化,以实现对待预测产品的交易数据的预测。
在一个实施例中,获取待训练产品的样本信息,包括:获取各个训练产品的历史样本信息;根据历史样本信息计算各个训练产品之间的历史相关性;根据历史相关性以及各个训练产品的历史样本信息生成第一类初始样本信息图;从第一类初始样本信息图中提取待训练产品的第一类初始样本信息。
其中,历史样本信息为市场上所有样本基金在目标时长内的历史净值信息、历史成交量信息。
具体地,终端获取市场上所有样本基金即各个训练产品在目标时长内的历史净值信息和历史成交量信息。根据不同样本基金的历史净值信息和历史成交量信息构建一个样本基金关系图即第一类初始样本信息图。在第一类初始样本信息图中,每个节点代表一只样本基金,节点之间根据由两个相关矩阵连接,这两个相关矩阵分别根据目标时长内的样本基金的净值变化和成交量情况以及各样本基金之间的统计相关性(例如,PearsonRank)获得的。样本基金关系图中的两个相关矩阵即样本基金关系图中的两种边关,分别为净值相关性和成交量相关性,边上的正值表示正相关,负值表示负相关。终端从样本基金关系图中提取待训练产品的净值变化趋势相关性和成交量变化趋势相关性,其中,待训练产品的净值变化趋势相关性和成交量变化趋势相关性即为第一类初始样本信息。
在本实施例中,通过各样本产品的历史样本信息可以得到待训练产品的第一类初始样本信息,以获取待训练产品的长期属性,并作为样本用户的历史样本产品交易行为的调节和补充,降低历史交易行为中存在的随机性的影响,提高初始交易数据预测模型对待训练产品的交易行为的预测准确性提供了基础。其中,样本用户为待训练产品的持有者。
在一个实施例中,获取待训练产品的样本信息,包括:获取各目标样本产品的真实样本信息;根据真实样本信息生成对应的第二类初始样本信息图;从第二类初始样本信息图中提取待训练产品的第二类初始样本信息。
其中,目标样本产品为样本目标用户持有的产品。若产品为基金,则目标样本产品为用户持有的基金。真实信息为样本目标用户在预设时长内的对各目标样本产品进行操作所产生的交易数据,其中,交易数据包括各目标样本产品在预设时长内的交易价格数据和交易量数据。
具体地,终端获取样本目标用户所持有的产品在预设时长内的交易价格数据和交易量数据,并将上述交易价格数据和交易量数据分别处理为价格样本图和交易量样本图。其中,价格样本图中的节点信息为样本目标用户所持有的产品在一个交易日的价格信息,交易量样本图中节点信息为样本目标用户所持有的产品在一个交易日的有效交易量信息,以及在预设时长中交易总量的占比。价格样本图和交易样本量图即为第二类初始样本信息图。终端从给第二类初始样本信息图中获取待训练产品的价格信息、有效交易量信息,以及有效交易量在预设时长中交易总量的占比,并将上述获取信息作为第二类初始样本信息。
本实施例中,终端通过各目标样本产品的真实信息提取待训练产品的第二类初始样本信息,即获取了待训练产品的短期信息,以对待训练产品的交易行为进行预测,增强预测的准确性。
在一个实施例中,对不同类型的初始样本信息进行处理得到初始模型输入信息,包括:将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;根据预先训练得到的模型对不同类型的产品样本信息图进行处理得到待训练产品对应的初始模型输入信息。
具体地,终端对第一类初始样本信息和第二类初始样本信息进行处理得到第一种类型的产品样本信息图。终端对第三类初始样本信息即新闻信息进行处理得到第二种类型的产品样本信息图。终端通过预先训练得到的模型对不同类型的产品样本信息图进行处理得到对应类型的产品信息以及产品关系。
本实施例中,将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;根据预先训练得到的模型对不同类型的产品样本信息图进行处理得到待训练产品对应的初始模型输入信息,以为初始交易数据预测模型提供预测数据。在一个实施例中,初始样本信息包括新闻样本信息,将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图,包括以下至少一个:将第一类初始样本信息与第二类初始样本信息通过第一模型进行信息聚合得到第一类样本关系图,并将第一类样本关系图通过第二模型进行序列信息建模得到对应的第一类产品样本信息图;和/或将新闻样本信息通过第三模型进行信息提取得到第二类产品样本信息图。
其中,第一模型为预先训练好的GCN模型,第二模型为预先训练好的LSTM模型,第三模型为另一预先训练好的LSTM模型。
具体地,终端将第一类初始样本信息即待训练产品的净值变化趋势相关性、成交量变化趋势相关性以及第二类初始样本信息中待训练产品的价格信息,通过预先训练好的GCN模型进行相邻信息的聚合得到对应的第一类关系样本图,并将对应的第一类关系样本图按照待训练产品的价格信息中的时间数列进行LSTM建模,以得到交易量时间序列样本信息图即第一类产品样本信息图中的一个。终端还将第一类初始样本信息即待训练产品的净值变化趋势相关性和成交量变化趋势相关性以及第二类初始样本信息即待训练产品的有效交易量信息、有效交易量在预设时长中交易总量的占比,通过预先训练好的GCN模型进行相邻信息的聚合得到对应的第一类关系样本图,并将对应的第一类关系样本图按照待训练产品的有效交易量信息、有效交易量在预设时长中交易总量的占比中的时间数列进行LSTM建模,以得到交易价格时间序列样本信息图即第一类产品样本信息图中的另一个。终端将新闻信息通过提取时间信息的第三LSTM模型进行信息提取得到第二类产品样本信息图。
在本实施例中,通过将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;以为初始交易数据预测模型输入信息进行处理,以得到模型输入信息。
在一个实施例中,一个交易数据预测模型可以对目标用户的交易行为进行预测,上述交易行为指目标用户对所持有的基金在下一交易日的操作,其中,目标用户对基金的操作包括买入或卖出。上述交易预测模型在投入使用前的构建过程如下:
需要说明的是本实施例中样本涉及的数据为目标客户近期的基金交易数据,市场上所有基金的近五年历史净值信息、历史成交量信息,以及在前一日到次日开盘前的基金相关的新闻信息。若观察数据缺失情况,对于有效交易时间少于5年的基金进行过滤删除。
“特征工程”部分处理步骤如下:
1、构建样本特征。给定过去N天(例如N可以取30)用户所持有的各基金的每日交易数据点,其中包括N个数据点X={x1,x2,…,xN},其中,xi包括交易量信息
Figure BDA0003485360250000151
和交易价格信息
Figure BDA0003485360250000152
交易价格信息
Figure BDA0003485360250000153
即为基金当日净值。
Figure BDA0003485360250000154
包括当日的有效交易量,包括买入和卖出量,以及占过去N天交易量总和的占比。
2、构建样本标签,样本的标签可以定义如下,买入定义标签为1,卖出定义标签为0。
训练过程如下:
获取待训练基金的样本信息,样本信息包括不同类型的初始样本信息,其中,第一类初始样本信息为待训练基金在目标时长内的净值相关性和成交量相关性;第二类初始样本信息为待训练基金在预设时长内的交易价格信息和交易数量信息,其中,交易价格信息为目标用户对待训练基金进行操作时的价格,交易数量信息为目标用户对待训练基金进行操作所对应的数量信息,且待训练基金为目标用户所持有的基金。需要说明的时,待训练基金为用于训练初始交易预测模型的样品。可选地,目标时长为五年,预设时长为30天。
第一类初始样本信息的获取方式为:获取市场上所有存续时长大于目标时长的基金的历史净值信息和历史成交量信息,根据各基金的历史净值信息和历史成交量信息构建了一个具有净值趋势关系和成交量趋势关系的基金关系图。在该图中,每个节点代表一只基金。节点由两个关联矩阵连接,这些矩阵是根据各基金在近五年内每个交易日的净值信息和成交量信息,通过基金之间的统计相关性获得的。通过基金关系图获取待训练基金的第一类初始样本信息即待训练基金的净值相关性和成交量相关性。
第二类初始样本信息的获取方式为:获取持有待训练基金的目标用户信息,根据目标用户信息获取其持有的各基金在预设时长内的交易价格数据和交易量数据,并将预设时长内目标用户持有的各基金的交易价格数据和交易量数据分别处理为价格图和数量图。价格图中节点信息为基金的在当天的价格信息。交易量图中节点信息为基金的在当天的有效交易量信息,以及占过去N天中交易总量的占比。从价格图和交易量图中获取待训练基金在预设时长内的交易价格数据和交易量数据。优选地,预设时长为30天。
第三类初始样本信息为:获取待训练基金在样本预测时间之前的新闻信息。
接下来将待训练基金的样本信息即第一类初始信息、第二类初始信息以及第三类初始信息进行处理得到初始交易预测模型的输入信息,所述初始模型输入信息包括不同类型的样本基金信息以及不同类型的样本基金关系,具体过程如下:
将第一类初始样本信息和第二类初始样本信息通过第一模型GCN和第二模型LSTM进行处理得到第一类基金样本信息图。具体地,第一类初始样本信息包括待训练基金的净值相关性A1,待训练基金的交易量相关性A2。第二类初始样本信息为待训练基金预设时长内的交易价格数据和交易量数据。第一类基金样本信息图中的交易量时间序列信息hv的生成公式(1)为:
hv=LSTM(GCN(A1,A2,近30天的交易量数据)) (1)
第一类基金样本信息图中的交易价格时间序列信息hp的生成公式(2)为:
hp=LSTM(GCN(A1,A2,近30天的交易价格数据)) (2)
其中,短期波动模块使模型学习目标用户的短期交易规律,短期波动模块的每一层都由两部分组成,分别是聚合步骤和更新步骤。聚合步骤中应用图神经网络(GCN)来进行建模。此外,为了对时间序列数据的序列信息进行建模,可将LSTM单元作为模块中的更新步骤。在第i个时间步的第l层(共m层),该过程可以表示为:
Figure BDA0003485360250000171
Figure BDA0003485360250000172
Figure BDA0003485360250000173
Figure BDA0003485360250000174
其中,Ar是关系r的连接矩阵(共两种关系,分别是基金间的净值相关性和成交量相关性),
Figure BDA0003485360250000175
表示归一化后的邻接矩阵即净值变化趋势相关性和成交量变化趋势相关性对应的归一化的矩阵,
Figure BDA0003485360250000176
是第l层中训练得到的关系r的过滤器,Hl是第l层的隐层表示。ξl是第l层的聚合邻居信息,fθ是一个以sigmoid作为激活函数的一层前馈网络,a,o,ρ分别代表输入、遗忘和输出门。x分别代表价格数据和交易量数据,分别作为价格图和交易量图的输入。
该短期波动模块首先使用聚合层聚合来自相邻节点的信息,然后使用门控机制来融合来自当前时间步
Figure BDA0003485360250000181
的前一层的信息,当前时间步的输入xi和聚合邻居信息
Figure BDA0003485360250000182
动态引导模型选择有价值的信息。
通过第二类初始样本信息即新闻信息构造突发新闻编码信息图。通过具有注意力机制的LSTM提取财经新闻的标题来表示,其公式(7)如下:
Figure BDA0003485360250000183
具体地,公式(7)包括公式(8)(9),
Figure BDA0003485360250000184
Figure BDA0003485360250000185
其中,zt是第t个词语的嵌入向量,e是基金节点嵌入向量作为执行注意力的查询。
根据第一类基金样本信息图和第二类基金样本信息图以及基金关系图最终得到关于目标用户基金交易信息的异构图如图3,图中节点信息包括过去一段时间目标用户的基金交易数量信息,基金交易价格信息,突发新闻信息(对应三个视角),图中边信息包括不同基金之间的净值变化趋势相关性和成交量变化趋势相关性(对应两个子图、两种相关关系)。从异构图中提取待训练基金的A1、A2、hv、hp
Figure BDA0003485360250000186
做为初始交易数据预测模型的输入。
在模型优化阶段,本实施例针对异构图设计的多视角异构图正则化项,通过最大化异构图的不同视角的输出结果之间的相关性,使构成异构图的子图在模型的学习过程中相互优化,提高模型泛化效果。根据待训练基金的A1、A2、hv、hp
Figure BDA0003485360250000187
构成正则化项(10)
Figure BDA0003485360250000188
其中,r=1,2代表净值相关性A1和成交量相关性A2
根据正则化项、待训练基金的样本输入至初始预测模型的输出结果以及待训练基金的样本标签构建目标函数,目标函数(11)如下:
Figure BDA0003485360250000191
其中,r=1,2代表净值相关性A1和成交量相关性A2,y为样本标签,Remp代表模型的经验损失,Rgraph代表多视角异构图正则化项。
通过目标函数对初始交易数据预测模型进行优化,直到满足预设需求得到优化后的交易预测模型。
其中,交易预测模型与初始交易预测模型的判别函数为(12)。
Figure BDA0003485360250000192
其中,f为模型的判别函数,节点信息包括新闻文本向量
Figure BDA0003485360250000193
价格向量hp,和交易量向量hv。边信息包括交易价格相关性A1和交易量相关性A2
Figure BDA0003485360250000194
为模型预测结果。
具体的,交易预测模型的应用如下:
获取目标用户的待预测基金的目标信息,将目标信息输入至交易预测模型,得到交易预测结果。
应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
基于同样的发明构思,本申请实施例还提供了一种用于实现上述所涉及的产品交易数据预测方法的产品交易数据预测装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的一个或多个产品交易数据预测装置实施例中的具体限定可以参见上文中对于产品交易数据预测方法的限定,在此不再赘述。
在一个实施例中,如图4所示,提供了一种产品交易数据预测装置,包括:信息获取模块100、信息处理模块200和预测模块300,其中:
信息获取模块100,用于获取待预测产品的目标信息,目标信息包括不同类型的初始信息。
信息处理模块200,用于对不同类型的初始信息进行处理得到模型输入信息,模型输入信息包括不同类型的产品信息以及不同类型的产品关系。
预测模块300,用于将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据。交易数据预测模型是在最大化不同类型的产品信息之间的相关性的前提下训练得到的。
在一个实施例中,信息获取模块100,包括:
相关性获取模块,用于获取各个产品的历史信息;根据历史信息计算各个产品之间的相关性;
第一类初始信息图生成模块,用于根据相关性以及各个产品的历史信息生成第一类初始信息图;
第一类初始信息提取模块,用于从第一类初始信息图中提取待预测产品的第一类初始信息。
在一个实施例中,信息获取模块100,包括:
真实信息获取模块,用于获取各目标产品的真实信息;
第二类初始信息图生成模块,用于根据真实信息生成对应的第二类初始信息图;
第二类初始信息提取模块,用于从第二类初始信息图中提取待预测产品的第二类初始信息。
在一个实施例中,信息处理模块200,包括:
不同信息图生成模块,用于将不同类型的初始信息进行处理得到不同类型的产品信息图;
模型输入信息获取模块,用于根据预先训练得到的模型对不同类型的产品信息图进行处理得到待预测产品对应的模型输入信息。
在一个实施例中,不同信息图生成模块,包括以下至少一个:
第一类产品信息图获得模块,用于将第一类初始信息与第二类初始信息通过第一模型进行信息聚合得到第一类关系图,并将第一类关系图通过提取时间信息的第二模型进行序列信息建模得到对应的第一类产品信息图;和/或
第二类产品信息图获得模块,用于将新闻信息通过提取时间信息的第三模型进行信息提取得到第二类产品信息图。
在一个实施例中,交易数据预测模型的训练过程包括:
样本信息获取模块,用于获取待训练产品的样本信息,样本信息包括不同类型的初始样本信息;
样本信息处理模块,用于对不同类型的初始样本信息进行处理得到初始模型输入信息,初始模型输入信息包括不同类型的样本产品信息以及不同类型的样本产品关系;
样本预测模块,用于将初始模型输入信息输入初始交易数据预测模型中,得到样本预测时间的样本预测交易数据;
目标函数形成模块,用于根据正则化项和样本预测交易数据形成目标函数,通过目标函数对初始交易数据预测模型进行优化得到交易数据预测模型;正则化项根据初始模型输入信息生成,用于最大化不同类型的样本产品信息之间的相关性。
在一个实施例中,样本信息获取模块,包括:
历史相关性获取模块,用于获取各个训练产品的历史样本信息;根据历史样本信息计算各个训练产品之间的历史相关性;
第一类初始样本信息图生成模块,用于根据历史相关性以及各个训练产品的历史样本信息生成第一类初始样本信息图;
第一类初始样本信息提取模块,用于从第一类初始样本信息图中提取待训练产品的第一类初始样本信息。
在一个实施例中,样本信息获取模块,包括:
真实样本信息获取模块,用于获取各目标样本产品的真实样本信息;
第二类初始样本信息图生成模块,用于根据真实样本信息生成对应的第二类初始样本信息图;
第二类初始样本信息提取模块,用于从第二类初始样本信息图中提取待训练产品的第二类初始样本信息。
在一个实施例中,样本信息处理模块,包括:
不同样本信息图生成模块,用于将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;
初始模型输入信息获取模块,用于根据预先训练得到的模型对不同类型的产品样本信息图进行处理得到待训练产品对应的初始模型输入信息。
在一个实施例中,不同样本信息图生成模块,包括以下至少一个:
第一类产品样本信息图获得模块,用于将第一类初始样本信息与第二类初始样本信息通过第一模型进行信息聚合得到第一类样本关系图,并将第一类样本关系图通过第二模型进行序列信息建模得到对应的第一类产品样本信息图;和/或
第二类产品样本信息图获得模块,用于将新闻样本信息通过第三模型进行信息提取得到第二类产品样本信息图。上述产品交易数据预测装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图5所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过WIFI、移动蜂窝网络、NFC(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现一种产品交易数据预测方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
本领域技术人员可以理解,图5中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
在一个实施例中,提供了一种计算机设备,包括存储器和处理器,存储器中存储有计算机程序,该处理器执行计算机程序时实现以下步骤:
获取待预测产品的目标信息,目标信息包括不同类型的初始信息;
对不同类型的初始信息进行处理得到模型输入信息,模型输入信息包括不同类型的产品信息以及不同类型的产品关系;
将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;交易数据预测模型是在最大化不同类型的产品信息之间的相关性的前提下训练得到的。
在一个实施例中,处理器执行计算机程序时所实现的获取待预测产品的目标信息,包括:
获取各个产品的历史信息;根据历史信息计算各个产品之间的相关性;
根据相关性以及各个产品的历史信息生成第一类初始信息图;
从第一类初始信息图中提取待预测产品的第一类初始信息。
在一个实施例中,处理器执行计算机程序时所实现的获取待预测产品的目标信息,包括:
获取各目标产品的真实信息;
根据真实信息生成对应的第二类初始信息图;
从第二类初始信息图中提取待预测产品的第二类初始信息。
在一个实施例中,处理器执行计算机程序时所实现的对不同类型的产品信息进行处理得到模型输入信息,包括:
将不同类型的初始信息进行处理得到不同类型的产品信息图;
根据预先训练得到的模型对不同类型的产品信息图进行处理得到待预测产品对应的模型输入信息。
在一个实施例中,处理器执行计算机程序时所实现的初始信息包括新闻信息,将不同类型的初始信息进行处理得到不同类型的产品信息图,包括以下至少一个:
将第一类初始信息与第二类初始信息通过第一模型进行信息聚合得到第一类关系图,并将第一类关系图通过提取时间信息的第二模型进行序列信息建模得到对应的第一类产品信息图;和/或
将新闻信息通过提取时间信息的第三模型进行信息提取得到第二类产品信息图。
在一个实施例中,处理器执行计算机程序时所实现的交易数据预测模型的训练过程包括:
获取待训练产品的样本信息,样本信息包括不同类型的初始样本信息;
对不同类型的初始样本信息进行处理得到初始模型输入信息,初始模型输入信息包括不同类型的样本产品信息以及不同类型的样本产品关系;
将初始模型输入信息输入初始交易数据预测模型中,得到样本预测时间的样本预测交易数据;
根据正则化项和样本预测交易数据形成目标函数,通过目标函数对初始交易数据预测模型进行优化得到交易数据预测模型;正则化项根据初始模型输入信息生成,用于最大化不同类型的样本产品信息之间的相关性。
在一个实施例中,处理器执行计算机程序时所实现的获取待训练产品的样本信息,包括:
获取各个训练产品的历史样本信息;根据历史样本信息计算各个训练产品之间的历史相关性;
根据历史相关性以及各个训练产品的历史样本信息生成第一类初始样本信息图;
从第一类初始样本信息图中提取待训练产品的第一类初始样本信息。
在一个实施例中,处理器执行计算机程序时所实现的获取待训练产品的样本信息,包括:
获取各目标样本产品的真实样本信息;
根据真实样本信息生成对应的第二类初始样本信息图;
从第二类初始样本信息图中提取待训练产品的第二类初始样本信息。
在一个实施例中,处理器执行计算机程序时所实现的对不同类型的初始样本信息进行处理得到初始模型输入信息,包括:
将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;
根据预先训练得到的模型对不同类型的产品样本信息图进行处理得到待训练产品对应的初始模型输入信息。
在一个实施例中,处理器执行计算机程序时所实现的初始样本信息包括新闻样本信息,将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图,包括以下至少一个:
将第一类初始样本信息与第二类初始样本信息通过第一模型进行信息聚合得到第一类样本关系图,并将第一类样本关系图通过第二模型进行序列信息建模得到对应的第一类产品样本信息图;和/或
将新闻样本信息通过第三模型进行信息提取得到第二类产品样本信息图。
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现以下步骤:
获取待预测产品的目标信息,目标信息包括不同类型的初始信息;
对不同类型的初始信息进行处理得到模型输入信息,模型输入信息包括不同类型的产品信息以及不同类型的产品关系;
将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;交易数据预测模型是在最大化不同类型的产品信息之间的相关性的前提下训练得到的。
在一个实施例中,计算机程序被处理器执行时所实现的获取待预测产品的目标信息,包括:
获取各个产品的历史信息;根据历史信息计算各个产品之间的相关性;
根据相关性以及各个产品的历史信息生成第一类初始信息图;
从第一类初始信息图中提取待预测产品的第一类初始信息。
在一个实施例中,计算机程序被处理器执行时所实现的获取待预测产品的目标信息,包括:
获取各目标产品的真实信息;
根据真实信息生成对应的第二类初始信息图;
从第二类初始信息图中提取待预测产品的第二类初始信息。
在一个实施例中,计算机程序被处理器执行时所实现的对不同类型的产品信息进行处理得到模型输入信息,包括:
将不同类型的初始信息进行处理得到不同类型的产品信息图;
根据预先训练得到的模型对不同类型的产品信息图进行处理得到待预测产品对应的模型输入信息。
在一个实施例中,计算机程序被处理器执行时所实现的初始信息包括新闻信息,将不同类型的初始信息进行处理得到不同类型的产品信息图,包括以下至少一个:
将第一类初始信息与第二类初始信息通过第一模型进行信息聚合得到第一类关系图,并将第一类关系图通过提取时间信息的第二模型进行序列信息建模得到对应的第一类产品信息图;和/或
将新闻信息通过提取时间信息的第三模型进行信息提取得到第二类产品信息图。
在一个实施例中,计算机程序被处理器执行时所实现的交易数据预测模型的训练过程包括:
获取待训练产品的样本信息,样本信息包括不同类型的初始样本信息;
对不同类型的初始样本信息进行处理得到初始模型输入信息,初始模型输入信息包括不同类型的样本产品信息以及不同类型的样本产品关系;
将初始模型输入信息输入初始交易数据预测模型中,得到样本预测时间的样本预测交易数据;
根据正则化项和样本预测交易数据形成目标函数,通过目标函数对初始交易数据预测模型进行优化得到交易数据预测模型;正则化项根据初始模型输入信息生成,用于最大化不同类型的样本产品信息之间的相关性。
在一个实施例中,计算机程序被处理器执行时所实现的获取待训练产品的样本信息,包括:
获取各个训练产品的历史样本信息;根据历史样本信息计算各个训练产品之间的历史相关性;
根据历史相关性以及各个训练产品的历史样本信息生成第一类初始样本信息图;
从第一类初始样本信息图中提取待训练产品的第一类初始样本信息。
在一个实施例中,计算机程序被处理器执行时所实现的获取待训练产品的样本信息,包括:
获取各目标样本产品的真实样本信息;
根据真实样本信息生成对应的第二类初始样本信息图;
从第二类初始样本信息图中提取待训练产品的第二类初始样本信息。
在一个实施例中,计算机程序被处理器执行时所实现的对不同类型的初始样本信息进行处理得到初始模型输入信息,包括:
将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;
根据预先训练得到的模型对不同类型的产品样本信息图进行处理得到待训练产品对应的初始模型输入信息。
在一个实施例中,计算机程序被处理器执行时所实现的初始样本信息包括新闻样本信息,将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图,包括以下至少一个:
将第一类初始样本信息与第二类初始样本信息通过第一模型进行信息聚合得到第一类样本关系图,并将第一类样本关系图通过第二模型进行序列信息建模得到对应的第一类产品样本信息图;和/或
将新闻样本信息通过第三模型进行信息提取得到第二类产品样本信息图。在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
获取待预测产品的目标信息,目标信息包括不同类型的初始信息;
对不同类型的初始信息进行处理得到模型输入信息,模型输入信息包括不同类型的产品信息以及不同类型的产品关系;
将模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;交易数据预测模型是在最大化不同类型的产品信息之间的相关性的前提下训练得到的。
在一个实施例中,计算机程序被处理器执行时所实现的获取待预测产品的目标信息,包括:
获取各个产品的历史信息;根据历史信息计算各个产品之间的相关性;
根据相关性以及各个产品的历史信息生成第一类初始信息图;
从第一类初始信息图中提取待预测产品的第一类初始信息。
在一个实施例中,计算机程序被处理器执行时所实现的获取待预测产品的目标信息,包括:
获取各目标产品的真实信息;
根据真实信息生成对应的第二类初始信息图;
从第二类初始信息图中提取待预测产品的第二类初始信息。
在一个实施例中,计算机程序被处理器执行时所实现的对不同类型的产品信息进行处理得到模型输入信息,包括:
将不同类型的初始信息进行处理得到不同类型的产品信息图;
根据预先训练得到的模型对不同类型的产品信息图进行处理得到待预测产品对应的模型输入信息。
在一个实施例中,计算机程序被处理器执行时所实现的初始信息包括新闻信息,将不同类型的初始信息进行处理得到不同类型的产品信息图,包括以下至少一个:
将第一类初始信息与第二类初始信息通过第一模型进行信息聚合得到第一类关系图,并将第一类关系图通过提取时间信息的第二模型进行序列信息建模得到对应的第一类产品信息图;和/或
将新闻信息通过提取时间信息的第三模型进行信息提取得到第二类产品信息图。
在一个实施例中,计算机程序被处理器执行时所实现的交易数据预测模型的训练过程包括:
获取待训练产品的样本信息,样本信息包括不同类型的初始样本信息;
对不同类型的初始样本信息进行处理得到初始模型输入信息,初始模型输入信息包括不同类型的样本产品信息以及不同类型的样本产品关系;
将初始模型输入信息输入初始交易数据预测模型中,得到样本预测时间的样本预测交易数据;
根据正则化项和样本预测交易数据形成目标函数,通过目标函数对初始交易数据预测模型进行优化得到交易数据预测模型;正则化项根据初始模型输入信息生成,用于最大化不同类型的样本产品信息之间的相关性。
在一个实施例中,计算机程序被处理器执行时所实现的获取待训练产品的样本信息,包括:
获取各个训练产品的历史样本信息;根据历史样本信息计算各个训练产品之间的历史相关性;
根据历史相关性以及各个训练产品的历史样本信息生成第一类初始样本信息图;
从第一类初始样本信息图中提取待训练产品的第一类初始样本信息。
在一个实施例中,计算机程序被处理器执行时所实现的获取待训练产品的样本信息,包括:
获取各目标样本产品的真实样本信息;
根据真实样本信息生成对应的第二类初始样本信息图;
从第二类初始样本信息图中提取待训练产品的第二类初始样本信息。
在一个实施例中,计算机程序被处理器执行时所实现的对不同类型的初始样本信息进行处理得到初始模型输入信息,包括:
将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;
根据预先训练得到的模型对不同类型的产品样本信息图进行处理得到待训练产品对应的初始模型输入信息。
在一个实施例中,计算机程序被处理器执行时所实现的初始样本信息包括新闻样本信息,将不同类型的初始样本信息进行处理得到不同类型的产品样本信息图,包括以下至少一个:
将第一类初始样本信息与第二类初始样本信息通过第一模型进行信息聚合得到第一类样本关系图,并将第一类样本关系图通过第二模型进行序列信息建模得到对应的第一类产品样本信息图;和/或
将新闻样本信息通过第三模型进行信息提取得到第二类产品样本信息图。需要说明的是,本申请所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等)和数据(包括但不限于用于分析的数据、存储的数据、展示的数据等),均为经用户授权或者经过各方充分授权的信息和数据。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(Read-OnlyMemory,ROM)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(ReRAM)、磁变存储器(Magnetoresistive Random Access Memory,MRAM)、铁电存储器(Ferroelectric Random Access Memory,FRAM)、相变存储器(Phase Change Memory,PCM)、石墨烯存储器等。易失性存储器可包括随机存取存储器(Random Access Memory,RAM)或外部高速缓冲存储器等。作为说明而非局限,RAM可以是多种形式,比如静态随机存取存储器(Static Random Access Memory,SRAM)或动态随机存取存储器(Dynamic RandomAccess Memory,DRAM)等。本申请所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本申请所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
以上所述实施例仅表达了本申请的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本申请专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本申请构思的前提下,还可以做出若干变形和改进,这些都属于本申请的保护范围。因此,本申请的保护范围应以所附权利要求为准。

Claims (14)

1.一种产品交易数据预测方法,其特征在于,所述方法包括:
获取待预测产品的目标信息,所述目标信息包括不同类型的初始信息;
对所述不同类型的初始信息进行处理得到模型输入信息,所述模型输入信息包括不同类型的产品信息以及不同类型的产品关系;
将所述模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;所述交易数据预测模型是在最大化所述不同类型的产品信息之间的相关性的前提下训练得到的。
2.根据权利要求1所述的方法,其特征在于,所述获取待预测产品的目标信息,包括:
获取各个产品的历史信息;根据所述历史信息计算各个产品之间的相关性;
根据所述相关性以及各个所述产品的历史信息生成第一类初始信息图;
从所述第一类初始信息图中提取所述待预测产品的第一类初始信息。
3.根据权利要求1所述的方法,其特征在于,所述获取待预测产品的目标信息,包括:
获取各目标产品的真实信息;
根据所述真实信息生成对应的第二类初始信息图;
从所述第二类初始信息图中提取所述待预测产品的第二类初始信息。
4.根据权利要求1所述的方法,其特征在于,所述对所述不同类型的产品信息进行处理得到模型输入信息,包括:
将所述不同类型的初始信息进行处理得到不同类型的产品信息图;
根据预先训练得到的模型对所述不同类型的产品信息图进行处理得到所述待预测产品对应的模型输入信息。
5.根据权利要求4所述的方法,其特征在于,所述初始信息包括新闻信息,所述将所述不同类型的初始信息进行处理得到不同类型的产品信息图,包括以下至少一个:
将所述第一类初始信息与所述第二类初始信息通过第一模型进行信息聚合得到第一类关系图,并将所述第一类关系图通过提取时间信息的第二模型进行序列信息建模得到对应的第一类产品信息图;和/或
将所述新闻信息通过提取时间信息的第三模型进行信息提取得到第二类产品信息图。
6.根据权利要求4所述的方法,其特征在于,所述交易数据预测模型的训练过程包括:
获取待训练产品的样本信息,所述样本信息包括不同类型的初始样本信息;
对所述不同类型的初始样本信息进行处理得到初始模型输入信息,所述初始模型输入信息包括不同类型的样本产品信息以及不同类型的样本产品关系;
将所述初始模型输入信息输入初始交易数据预测模型中,得到样本预测时间的样本预测交易数据;
根据正则化项和所述样本预测交易数据形成目标函数,通过所述目标函数对所述初始交易数据预测模型进行优化得到所述交易数据预测模型;所述正则化项根据所述初始模型输入信息生成,用于最大化所述不同类型的样本产品信息之间的相关性。
7.根据权利要求6所述的方法,其特征在于,所述获取待训练产品的样本信息,包括:
获取各个训练产品的历史样本信息;根据所述历史样本信息计算各个所述训练产品之间的历史相关性;
根据所述历史相关性以及各个所述训练产品的历史样本信息生成第一类初始样本信息图;
从所述第一类初始样本信息图中提取所述待训练产品的第一类初始样本信息。
8.根据权利要求7所述的方法,其特征在于,所述获取待训练产品的样本信息,包括:
获取各目标样本产品的真实样本信息;
根据所述真实样本信息生成对应的第二类初始样本信息图;
从所述第二类初始样本信息图中提取所述待训练产品的第二类初始样本信息。
9.根据权利要求8所述的方法,其特征在于,所述对所述不同类型的初始样本信息进行处理得到初始模型输入信息,包括:
将所述不同类型的初始样本信息进行处理得到不同类型的产品样本信息图;
根据预先训练得到的所述模型对所述不同类型的产品样本信息图进行处理得到所述待训练产品对应的初始模型输入信息。
10.根据权利要求9所述的方法,其特征在于,所述初始样本信息包括新闻样本信息,所述将所述不同类型的初始样本信息进行处理得到不同类型的产品样本信息图,包括以下至少一个:
将所述第一类初始样本信息与所述第二类初始样本信息通过所述第一模型进行信息聚合得到第一类样本关系图,并将所述第一类样本关系图通过所述第二模型进行序列信息建模得到对应的第一类产品样本信息图;和/或
将所述新闻样本信息通过所述第三模型进行信息提取得到第二类产品样本信息图。
11.一种产品交易预测装置,其特征在于,所述装置包括:
信息获取模块,用于获取待预测产品的目标信息,所述目标信息包括不同类型的初始信息;
信息处理模块,用于对所述不同类型的初始信息进行处理得到模型输入信息,所述模型输入信息包括不同类型的产品信息以及不同类型的产品关系;
预测模块,用于将所述模型输入信息输入交易数据预测模型中,得到预测时间的预测交易数据;所述交易数据预测模型是在最大化所述不同类型的产品信息之间的相关性的前提下训练得到的。
12.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至10中任一项所述的方法的步骤。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
14.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至10中任一项所述的方法的步骤。
CN202210079567.7A 2022-01-24 2022-01-24 产品交易数据预测方法、装置、设备、介质和程序产品 Pending CN114219184A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202210079567.7A CN114219184A (zh) 2022-01-24 2022-01-24 产品交易数据预测方法、装置、设备、介质和程序产品

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202210079567.7A CN114219184A (zh) 2022-01-24 2022-01-24 产品交易数据预测方法、装置、设备、介质和程序产品

Publications (1)

Publication Number Publication Date
CN114219184A true CN114219184A (zh) 2022-03-22

Family

ID=80708731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202210079567.7A Pending CN114219184A (zh) 2022-01-24 2022-01-24 产品交易数据预测方法、装置、设备、介质和程序产品

Country Status (1)

Country Link
CN (1) CN114219184A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115223271A (zh) * 2022-06-28 2022-10-21 东软睿驰汽车技术(沈阳)有限公司 车辆剩余信息误差的关注度获得方法及相关装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN115223271A (zh) * 2022-06-28 2022-10-21 东软睿驰汽车技术(沈阳)有限公司 车辆剩余信息误差的关注度获得方法及相关装置
CN115223271B (zh) * 2022-06-28 2024-05-07 东软睿驰汽车技术(沈阳)有限公司 车辆剩余信息误差的关注度获得方法及相关装置

Similar Documents

Publication Publication Date Title
CN109783730A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN109493199A (zh) 产品推荐方法、装置、计算机设备和存储介质
US20230342797A1 (en) Object processing method based on time and value factors
CN115080868A (zh) 产品推送方法、装置、计算机设备、存储介质和程序产品
CN114741402A (zh) 业务特征池的处理方法、装置、计算机设备和存储介质
CN114219184A (zh) 产品交易数据预测方法、装置、设备、介质和程序产品
CN114782960B (zh) 模型训练方法、装置、计算机设备及计算机可读存储介质
CN114529399A (zh) 用户数据处理方法、装置、计算机设备和存储介质
CN116764236A (zh) 游戏道具推荐方法、装置、计算机设备和存储介质
CN114549174A (zh) 用户行为预测方法、装置、计算机设备和存储介质
CN116823384A (zh) 产品推荐方法、装置、设备、存储介质和计算机程序产品
CN115049487A (zh) 产品信息处理方法、装置、设备、存储介质和程序产品
CN116127183A (zh) 业务推荐方法、装置、计算机设备和存储介质
CN114820082A (zh) 消费额度预测方法、装置、计算机设备和存储介质
CN115757971A (zh) 业务对象推荐方法、装置、计算机设备和存储介质
CN115564561A (zh) 企业数据处理方法、装置和计算机设备
CN117745337A (zh) 产品生成方法、装置、计算机设备和存储介质
CN116861071A (zh) 资讯推送方法、装置、计算机设备、存储介质和程序产品
CN117151884A (zh) 资产管理数据处理方法、装置、计算机设备和存储介质
CN115952358A (zh) 产品推荐方法、装置、计算机设备和存储介质
CN115827983A (zh) 一种用户行为预测方法、装置、电子设备及存储介质
CN116703544A (zh) 资源互动轨迹预测方法、装置、计算机设备和存储介质
CN116307231A (zh) 超期预测方法、装置、计算机设备和存储介质
CN115034885A (zh) 用户还款逾期预测方法、装置和计算机设备
CN115375454A (zh) 用户数据处理方法、装置、计算机设备、存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination