CN116228424A - 基于迁移学习优化的模拟撮合方法 - Google Patents

基于迁移学习优化的模拟撮合方法 Download PDF

Info

Publication number
CN116228424A
CN116228424A CN202310239636.0A CN202310239636A CN116228424A CN 116228424 A CN116228424 A CN 116228424A CN 202310239636 A CN202310239636 A CN 202310239636A CN 116228424 A CN116228424 A CN 116228424A
Authority
CN
China
Prior art keywords
data
transaction
historical
model
company
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202310239636.0A
Other languages
English (en)
Other versions
CN116228424B (zh
Inventor
肖林
黄国柱
杨洲杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Shenyi Technology Co ltd
Original Assignee
Shenzhen Shenyi Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Shenyi Technology Co ltd filed Critical Shenzhen Shenyi Technology Co ltd
Priority to CN202310239636.0A priority Critical patent/CN116228424B/zh
Priority claimed from CN202310239636.0A external-priority patent/CN116228424B/zh
Publication of CN116228424A publication Critical patent/CN116228424A/zh
Application granted granted Critical
Publication of CN116228424B publication Critical patent/CN116228424B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/04Trading; Exchange, e.g. stocks, commodities, derivatives or currency exchange
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02TCLIMATE CHANGE MITIGATION TECHNOLOGIES RELATED TO TRANSPORTATION
    • Y02T10/00Road transport of goods or passengers
    • Y02T10/10Internal combustion engine [ICE] based vehicles
    • Y02T10/40Engine management systems

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Accounting & Taxation (AREA)
  • Finance (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computational Linguistics (AREA)
  • Strategic Management (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Economics (AREA)
  • Health & Medical Sciences (AREA)
  • Development Economics (AREA)
  • Artificial Intelligence (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Technology Law (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Molecular Biology (AREA)
  • Computing Systems (AREA)
  • General Engineering & Computer Science (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提出一种基于迁移学习优化的模拟撮合方法,基于迁移学习技术得到待交易对象的第一/第二行情数据集;根据第一行情数据集和第一神经网络得到第一行情数据模型;根据第二行情数据集和第二神经网络得到第二行情数据模型;利用历史交易数据和历史行情数据对第三神经网络进行训练得到第一交易模型;将当前行情数据输入第一行情数据模型得第一当前行情数据;将第一当前行情数据输入第二行情数据模型得第二当前行情数据;第一当前行情数据中的第二当前行情数据剔除,得到第三当前行情数据;根据第三当前行情数据和第一交易模型得出模拟交易结果。本方案利用迁移学习技术可以精准得到影响待交易对象交易情况的当前行情数据,保证了交易的准确性。

Description

基于迁移学习优化的模拟撮合方法
技术领域
本发明涉及人工智能技术领域,具体涉及一种基于迁移学习优化的模拟撮合方法。
背景技术
随着经济全球化的不断深入,对交易服务的稳定性和实时性要求越来越高,也需要撮合交易平台来提供更强大的业务服务。目前,在进行证券交易时,个人客户和机构客户通常会采用证券交易软件进行交易,而当需要进行交易策略测试时,通常会采用证券交易软件的模拟撮合系统对证券交易业务进行测试,以确保交易策略实施的准确性。市场上的模拟撮合系统通常提供一个模拟的交易行情市场并采用见单成交的撮合策略,即客户提交一个报单,撮合模拟系统会根据模拟的交易行情市场进行撮合并交易成功,然而这种模拟撮合系统的精准度无法满足交易策略测试的需求。
发明内容
本发明正是基于上述问题,提出了一种基于迁移学习优化的模拟撮合方法,通过本发明的方案,利用迁移学习技术可以精准得到影响待交易对象交易情况的当前行情数据,保证了交易的准确性。
有鉴于此,本发明的一方面提出了一种基于迁移学习优化的模拟撮合方法,包括:
获取待交易对象的第一特征数据;
根据所述第一特征数据得到所述待交易对象的多个关联对象;
获取所述多个关联对象的历史交易数据和历史行情数据;
根据所述第一特征数据和所述历史行情数据,基于迁移学习技术得到所述待交易对象的第一行情数据集和第二行情数据集;
根据所述第一行情数据集和第一神经网络得到第一行情数据模型;
根据所述第二行情数据集和第二神经网络得到第二行情数据模型;
利用所述历史交易数据和所述历史行情数据对第三神经网络进行训练得到第一交易模型;
获取当前行情数据;
将所述当前行情数据输入所述第一行情数据模型得第一当前行情数据;
将所述第一当前行情数据输入所述第二行情数据模型得到第二当前行情数据;
所述第一当前行情数据中的所述第二当前行情数据剔除,得到第三当前行情数据;
根据所述第三当前行情数据和所述第一交易模型得出模拟交易结果。
可选地,所述根据所述第一特征数据得到所述待交易对象的多个关联对象的步骤,包括:
对所述第一特征数据进行处理,基于不同维度生成多个特征数据集;
利用所述多个特征数据集和预先训练好的交易对象画像模型生成所述待交易对象的第一画像;
采集金融交易数据;
结合语义识别算法对所述金融交易数据进行处理,并利用所述第一画像和预先训练好的关系抽取模型得到所述多个关联对象。
可选地,所述根据所述第一特征数据和所述历史行情数据,基于迁移学习技术得到所述待交易对象的第一行情数据集和第二行情数据集的步骤,包括:
将所述历史行情数据分为训练集和测试集;
将所述训练集输入深度学习神经网络进行训练,得到第一历史行情数据模型;
利用所述测试集对所述第一历史行情模型进行测试,并根据测试结果对所述第一历史行情数据模型进行调整得到第二历史行情数据模型;
根据所述第一特征数据获取所述待交易对象的第一目标行情数据;
基于迁移学习技术,利用所述第一目标行情数据对所述第二历史行情数据模型进行调整,得到调整后的历史行情数据模型;
将所述历史行情数据输入所述历史行情数据模型,得到所述第一行情数据集;
从所述历史行情数据剔除所述第一行情数据集,得到与所述待交易对象不相关的所述第二行情数据集。
可选地,所述根据所述第二行情数据集和第二神经网络得到第二行情数据模型的步骤,包括:
将所述第二行情数据集分为训练集、验证集和测试集;
将所述训练集输入所述第二神经网络的输入层以提取训练语句特征;
将所述训练语句特征输入与所述输入层通过矩阵运算建立连接的所述第二神经网络的第一隐藏层;
所述第一隐藏层将所述训练语句特征进行合并,将合并后的训练语句特征进行特征向量的转变为特定的输出维度并利用第一激活函数进行激活得到第一输出数据;
将所述第一输出数据输入所述第二神经网络的模拟输出层;
所述模拟输出层将所述第一输出数据通过矩阵计算得出模拟输出值,并将所述模拟输出值输入所述第二隐藏层;
所述第二隐藏层将所述模拟输出值通过矩阵计算得出验证输出结果;
将所述测试集输入所述输入层以提取测试语句特征;
所述输入层将所述测试语句特征传输至所述第二隐藏层进行数据连接;
所述第二隐藏层将所述测试语句特征通过第二激活函数进行激活后,再通过矩阵计算得出第二输出数据,将所述第二输出数据与所述验证输出结果发送至所述第二神经网络的验证系数层进行验证得出正规化系数;
将所述正规化系数与所述模拟输出值发送至所述第二神经网络的输出层,所述输出层对所述模拟输出值进行正规化处理得到拟态结果;
根据所述拟态结果生成初始第二行情数据模型;
将所述验证集输入所述初始第二行情数据模型,得到正反馈数据和逆反馈数据;
根据所述正反馈数据和所述逆反馈数据对所述初始第二行情数据模型进行修正,生成所述第二行情数据模型。
可选地,所述获取所述多个关联对象的历史交易数据和历史行情数据的步骤,包括:
根据所述多个关联对象的名称和代码获取所述历史交易数据;
根据所述多个关联对象的名称、所属行业领域名称、所涉业务名称确定关键词数据;
基于词向量技术进行语义相似度分析以获取与所述关键词数据的词向量相似的衍生关键词数据;
根据所述关键词数据和所述衍生关键词数据获取相关的文本、音频、图像和视频作为原始历史行情数据;
对所述原始历史行情数据进行分析处理,得到所述历史行情数据。
可选地,所述根据所述第三当前行情数据和所述第一交易模型得出模拟交易结果的步骤,包括:
获取所述待交易对象的待交易对象历史交易数据;
根据所述第一行情数据和所述待交易对象历史交易数据对所述第一交易模型进行修改得到第二交易模型;
将所述第三当前行情数据输入所述第二交易模型,得到出模拟交易结果。
可选地,所述利用所述历史交易数据和所述历史行情数据对第三神经网络进行训练得到第一交易模型的步骤,包括:
根据所述第一特征数据确定所述待交易对象所属的行业领域;
从所述历史交易数据和所述历史行情数据提取出与所述行业领域对应的行业历史交易数据和行业历史行情数据;
将所述行业历史交易数据和所述行业历史行情数据输入所述第三神经网络进行训练得到行业交易模型;
将所述行业交易模型作为所述第一交易模型。
可选地,所述待交易对象为公司股票;所述将所述行业交易模型作为所述第一交易模型的步骤之后,还包括:
根据所述第一特征数据确定所述待交易对象的所有同类公司清单;
根据所述同类公司清单,从所述历史交易数据和所述历史行情数据提取出对应的同类公司历史交易数据和同类公司历史行情数据;
利用所述同类公司历史交易数据和所述同类公司历史行情数据对所述行业交易模型进行修正,得到同类公司交易模型;
用所述同类公司交易模型替换所述行业交易模型,作为所述第一交易模型。
可选地,所述用所述同类公司交易模型替换所述行业交易模型,作为所述第一交易模型的步骤之后,还包括:
根据所述同类公司清单,获取所有同类公司的年报数据以得到所述所有同类公司的同类公司体量数据和同类公司业绩数据;
获取所述待交易对象所属交易对象公司的年报数据以得到所述交易对象公司的交易对象公司体量数据和交易对象公司业绩数据;
将所述同类公司体量数据和所述同类公司业绩数据与所述交易对象公司体量数据和所述交易对象公司业绩数据进行比对分析,确定出与所述交易对象公司在体量和业绩方面最接近的第一同类公司;
从所述历史交易数据和所述历史行情数据提取出所述第一同类公司的第一同类公司历史交易数据和第一同类公司历史行情数据
利用所述第一同类公司历史交易数据和所述第一同类公司历史行情数据对所述同类公司交易模型进行修正,得到第一同类公司交易模型;
用所述第一同类公司交易模型替换所述同类公司交易模型,作为所述第一交易模型。
可选地,所述用所述第一同类公司交易模型替换所述同类公司交易模型,作为所述第一交易模型的步骤之后,还包括:
将所述同类公司体量数据和所述同类公司业绩数据与所述交易对象公司体量数据和所述交易对象公司业绩数据进行比对分析,确定出预设时间间隔前与所述交易对象公司在体量和业绩方面最接近的第二同类公司;
从所述历史交易数据和所述历史行情数据提取出所述第二同类公司的第二同类公司历史交易数据和第二同类公司历史行情数据
利用所述第二同类公司历史交易数据和所述第二同类公司历史行情数据对所述第一同类公司交易模型进行修正,得到第二同类公司交易模型;
用所述第二同类公司交易模型替换所述第一同类公司交易模型,作为所述第一交易模型。
采用本发明的技术方案,基于迁移学习优化的模拟撮合方法通过获取待交易对象的第一特征数据;根据所述第一特征数据得到所述待交易对象的多个关联对象;获取所述多个关联对象的历史交易数据和历史行情数据;根据所述第一特征数据和所述历史行情数据,基于迁移学习技术得到所述待交易对象的第一行情数据集和第二行情数据集;根据所述第一行情数据集和第一神经网络得到第一行情数据模型;根据所述第二行情数据集和第二神经网络得到第二行情数据模型;利用所述历史交易数据和所述历史行情数据对第三神经网络进行训练得到第一交易模型;获取当前行情数据;将所述当前行情数据输入所述第一行情数据模型得第一当前行情数据;将所述第一当前行情数据输入所述第二行情数据模型得到第二当前行情数据;所述第一当前行情数据中的所述第二当前行情数据剔除,得到第三当前行情数据;根据所述第三当前行情数据和所述第一交易模型得出模拟交易结果。通过本发明的方案,利用迁移学习技术可以精准得到影响待交易对象交易情况的当前行情数据,保证了交易的准确性。
附图说明
图1是本发明一个实施例提供的基于迁移学习优化的模拟撮合方法的流程图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施方式对本发明进行进一步的详细描述。需要说明的是,在不冲突的情况下,本申请的实施例及实施例中的特征可以相互组合。
在下面的描述中阐述了很多具体细节以便于充分理解本发明,但是,本发明还可以采用其他不同于在此描述的方式来实施,因此,本发明的保护范围并不受下面公开的具体实施例的限制。
本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别不同对象,而不是用于描述特定顺序。此外,术语“包括”和“具有”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元,而是可选地还包括没有列出的步骤或单元,或可选地还包括对于这些过程、方法、产品或设备固有的其他步骤或单元。
在本文中提及“实施例”意味着,结合实施例描述的特定特征、结构或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例,也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是,本文所描述的实施例可以与其它实施例相结合。
下面参照图1来描述根据本发明一些实施方式提供的基于迁移学习优化的模拟撮合方法。
如图1所示,本发明一个实施例提供一种基于迁移学习优化的模拟撮合方法,包括:
获取待交易对象的第一特征数据;
在本步骤中,所述待交易对象可以是在国际上各大交易所进行交易的公司股票,但并不限于此。所述第一特征数据包括但不限于待交易对象对应的公司所属行业、概念、地区、风格、主题,以及主营业务、产品等。
根据所述第一特征数据得到所述待交易对象的多个关联对象;
获取所述多个关联对象的历史交易数据和历史行情数据;
在本步骤中,可以通过多个关联对象的公开数据(如年报、季报、证券交易机构公开的数据、新闻数据等)获得所述历史交易数据和历史行情数据。
根据所述第一特征数据和所述历史行情数据,基于迁移学习技术得到所述待交易对象的第一行情数据集和第二行情数据集;
根据所述第一行情数据集和第一神经网络得到第一行情数据模型;
根据所述第二行情数据集和第二神经网络得到第二行情数据模型;
在本步骤中,所述第二行情数据集为不影响所述待交易对象的交易情况的行情数据。
利用所述历史交易数据和所述历史行情数据对第三神经网络进行训练得到第一交易模型;
获取当前行情数据;
将所述当前行情数据输入所述第一行情数据模型得第一当前行情数据;
将所述第一当前行情数据输入所述第二行情数据模型得到第二当前行情数据;
将所述第一当前行情数据中的所述第二当前行情数据剔除,得到第三当前行情数据;
在本步骤中,将所述第一当前行情数据中的所述第二当前行情数据剔除后,得到了影响所述待交易对象的交易情况的第三当前行情数据。
根据所述第三当前行情数据和所述第一交易模型得出模拟交易结果。
采用该实施例的技术方案,通过获取待交易对象的第一特征数据;根据所述第一特征数据得到所述待交易对象的多个关联对象;获取所述多个关联对象的历史交易数据和历史行情数据;根据所述第一特征数据和所述历史行情数据,基于迁移学习技术得到所述待交易对象的第一行情数据集和第二行情数据集;根据所述第一行情数据集和第一神经网络得到第一行情数据模型;根据所述第二行情数据集和第二神经网络得到第二行情数据模型;利用所述历史交易数据和所述历史行情数据对第三神经网络进行训练得到第一交易模型;获取当前行情数据;将所述当前行情数据输入所述第一行情数据模型得第一当前行情数据;将所述第一当前行情数据输入所述第二行情数据模型得到第二当前行情数据;所述第一当前行情数据中的所述第二当前行情数据剔除,得到第三当前行情数据;根据所述第三当前行情数据和所述第一交易模型得出模拟交易结果。通过本发明的方案,利用迁移学习技术可以精准得到影响待交易对象交易情况的当前行情数据,保证了交易的准确性。
在本发明一些可能的实施方式中,所述根据所述第一特征数据得到所述待交易对象的多个关联对象的步骤,包括:
对所述第一特征数据进行处理,基于不同维度生成多个特征数据集;
利用所述多个特征数据集和预先训练好的交易对象画像模型生成所述待交易对象的第一画像;
采集金融交易数据;
结合语义识别算法对所述金融交易数据进行处理,并利用所述第一画像和预先训练好的关系抽取模型得到所述多个关联对象。
可以理解的是,为了能够全面且准确地获取与待交易对象相关的数据,在本实施例中,通过对所述第一特征数据进行处理,基于不同维度生成多个特征数据集;利用所述多个特征数据集和预先训练好的交易对象画像模型生成所述待交易对象的第一画像,第一画像可以是基于不同的核心维度生成了多个从而构成第一画像集以提供更细粒度的数据分析;通过在网站服务器上采集金融交易数据,再结合语义识别算法对所述金融交易数据进行处理,并利用所述第一画像和预先训练好的关系抽取模型确定各个对象之前的关系以得到所述多个关联对象。
在本发明一些可能的实施方式中,所述根据所述第一特征数据和所述历史行情数据,基于迁移学习技术得到所述待交易对象的第一行情数据集和第二行情数据集的步骤,包括:
将所述历史行情数据分为训练集和测试集;
将所述训练集输入深度学习神经网络进行训练,得到第一历史行情数据模型;
利用所述测试集对所述第一历史行情模型进行测试,并根据测试结果对所述第一历史行情数据模型进行调整得到第二历史行情数据模型;
根据所述第一特征数据获取所述待交易对象的第一目标行情数据;
基于迁移学习技术,利用所述第一目标行情数据对所述第二历史行情数据模型进行调整,得到调整后的历史行情数据模型;
将所述历史行情数据输入所述历史行情数据模型,得到所述第一行情数据集;
从所述历史行情数据剔除所述第一行情数据集,得到与所述待交易对象不相关的所述第二行情数据集。
可以理解的是,为了精确地获得影响待交易对象的交易的行业数据,需要对噪音数据进行剔除,在本发明实施例中,通过将所述历史行情数据分为训练集和测试集;将所述训练集输入深度学习神经网络进行训练,得到第一历史行情数据模型;利用所述测试集对所述第一历史行情模型进行测试,并根据测试结果对所述第一历史行情数据模型进行调整得到第二历史行情数据模型;根据所述第一特征数据获取所述待交易对象的第一目标行情数据,即根据待交易对象的特征确定(如利用语义相关性确定)一部分精确相关联的行情数据;基于迁移学习技术,利用所述第一目标行情数据对所述第二历史行情数据模型进行调整,得到调整后的历史行情数据模型;将所述历史行情数据输入所述历史行情数据模型,得到所述第一行情数据集;从所述历史行情数据剔除所述第一行情数据集,得到与所述待交易对象不相关的所述第二行情数据集,即噪音数据。
在本发明一些可能的实施方式中,所述根据所述第二行情数据集和第二神经网络得到第二行情数据模型的步骤,包括:
将所述第二行情数据集分为训练集、验证集和测试集;
将所述训练集输入所述第二神经网络的输入层以提取训练语句特征;
将所述训练语句特征输入与所述输入层通过矩阵运算建立连接的所述第二神经网络的第一隐藏层;
所述第一隐藏层将所述训练语句特征进行合并,将合并后的训练语句特征进行特征向量的转变为特定的输出维度并利用第一激活函数进行激活得到第一输出数据;
将所述第一输出数据输入所述第二神经网络的模拟输出层;
所述模拟输出层将所述第一输出数据通过矩阵计算得出模拟输出值,并将所述模拟输出值输入所述第二隐藏层;
所述第二隐藏层将所述模拟输出值通过矩阵计算得出验证输出结果;
将所述测试集输入所述输入层以提取测试语句特征;
所述输入层将所述测试语句特征传输至所述第二隐藏层进行数据连接;
所述第二隐藏层将所述测试语句特征通过第二激活函数进行激活后,再通过矩阵计算得出第二输出数据,将所述第二输出数据与所述验证输出结果发送至所述第二神经网络的验证系数层进行验证得出正规化系数;
将所述正规化系数与所述模拟输出值发送至所述第二神经网络的输出层,所述输出层对所述模拟输出值进行正规化处理得到拟态结果;
根据所述拟态结果生成初始第二行情数据模型;
将所述验证集输入所述初始第二行情数据模型,得到正反馈数据和逆反馈数据;
根据所述正反馈数据和所述逆反馈数据对所述初始第二行情数据模型进行修正,生成所述第二行情数据模型。
可以理解的是,为了能精确地剔除噪音数据,在本实施例中,通过大数据对神经网络进行训练,得到了精确的噪音数据模型,即第二行情数据模型。
在本发明一些可能的实施方式中,所述获取所述多个关联对象的历史交易数据和历史行情数据的步骤,包括:
根据所述多个关联对象的名称和代码获取所述历史交易数据;
根据所述多个关联对象的名称、所属行业领域名称、所涉业务名称确定关键词数据;
基于词向量技术进行语义相似度分析以获取与所述关键词数据的词向量相似的衍生关键词数据;
根据所述关键词数据和所述衍生关键词数据获取相关的文本、音频、图像和视频作为原始历史行情数据;
对所述原始历史行情数据进行分析处理,得到所述历史行情数据。
可以理解的是,为了得到准确的历史行情数据,在本实施例中,通过确定关键词并对其进行扩展,可以得到大量原始历史行情数据,再对所述原始历史行情数据进行数据标准化、数据清洗等后进行数据分析,得到历史行情数据。
在本发明一些可能的实施方式中,所述根据所述第三当前行情数据和所述第一交易模型得出模拟交易结果的步骤,包括:
获取所述待交易对象的待交易对象历史交易数据;
根据所述第一行情数据和所述待交易对象历史交易数据对所述第一交易模型进行修改得到第二交易模型;
将所述第三当前行情数据输入所述第二交易模型,得到出模拟交易结果。
可以理解的是,为了保证最终采用的交易模型的准确性,在本实施例中,通过获取所述待交易对象的待交易对象历史交易数据;结合迁移学习技术,根据所述第一行情数据和所述待交易对象历史交易数据对所述第一交易模型进行修改得到第二交易模型得到更契合所述待交易对象的交易模型;将所述第三当前行情数据输入所述第二交易模型,得到出模拟交易结果。
在本发明一些可能的实施方式中,所述利用所述历史交易数据和所述历史行情数据对第三神经网络进行训练得到第一交易模型的步骤,包括:
根据所述第一特征数据确定所述待交易对象所属的行业领域;
从所述历史交易数据和所述历史行情数据提取出与所述行业领域对应的行业历史交易数据和行业历史行情数据;
将所述行业历史交易数据和所述行业历史行情数据输入所述第三神经网络进行训练得到行业交易模型;
将所述行业交易模型作为所述第一交易模型。
可以理解的是,在本实施例中,根据所述待交易对象所属的行业领域,从所述历史交易数据和所述历史行情数据提取出与所述行业领域对应的行业历史交易数据和行业历史行情数据,进一步针对性地缩小数据的范围可以大大减少噪音数据从而得到精准的数据;将所述行业历史交易数据和所述行业历史行情数据输入所述第三神经网络进行训练得到行业交易模型。
在本发明一些可能的实施方式中,所述待交易对象为公司股票;所述将所述行业交易模型作为所述第一交易模型的步骤之后,还包括:
根据所述第一特征数据确定所述待交易对象的所有同类公司清单;
根据所述同类公司清单,从所述历史交易数据和所述历史行情数据提取出对应的同类公司历史交易数据和同类公司历史行情数据;
利用所述同类公司历史交易数据和所述同类公司历史行情数据对所述行业交易模型进行修正,得到同类公司交易模型;
用所述同类公司交易模型替换所述行业交易模型,作为所述第一交易模型。
可以理解的是,在本实施例中,利用与待交易对象对应的交易对象公司的同类公司的数据,对所述行业交易模型进行修正,可以得到更精准的同类公司交易模型。
在本发明一些可能的实施方式中,所述用所述同类公司交易模型替换所述行业交易模型,作为所述第一交易模型的步骤之后,还包括:
根据所述同类公司清单,获取所有同类公司的年报数据以得到所述所有同类公司的同类公司体量数据和同类公司业绩数据;
获取所述待交易对象所属交易对象公司的年报数据以得到所述交易对象公司的交易对象公司体量数据和交易对象公司业绩数据;
将所述同类公司体量数据和所述同类公司业绩数据与所述交易对象公司体量数据和所述交易对象公司业绩数据进行比对分析,确定出与所述交易对象公司在体量和业绩方面最接近的第一同类公司;
从所述历史交易数据和所述历史行情数据提取出所述第一同类公司的第一同类公司历史交易数据和第一同类公司历史行情数据;
利用所述第一同类公司历史交易数据和所述第一同类公司历史行情数据对所述同类公司交易模型进行修正,得到第一同类公司交易模型;
用所述第一同类公司交易模型替换所述同类公司交易模型,作为所述第一交易模型。
可以理解的是,与待交易对象对应的交易对象公司目前的体量和业绩最接近的第一同类公司的第一同类公司历史交易数据和第一同类公司历史行情数据,对于待交易对象具有重要的参考意义,本实施例中,利用第一同类公司历史交易数据和第一同类公司历史行情数据对所述同类公司交易模型进行修正,可以得到更准确的第一同类公司交易模型。
在本发明一些可能的实施方式中,所述用所述第一同类公司交易模型替换所述同类公司交易模型,作为所述第一交易模型的步骤之后,还包括:
将所述同类公司体量数据和所述同类公司业绩数据与所述交易对象公司体量数据和所述交易对象公司业绩数据进行比对分析,确定出预设时间间隔前与所述交易对象公司在体量和业绩方面最接近的第二同类公司;
从所述历史交易数据和所述历史行情数据提取出所述第二同类公司的第二同类公司历史交易数据和第二同类公司历史行情数据;
利用所述第二同类公司历史交易数据和所述第二同类公司历史行情数据对所述第一同类公司交易模型进行修正,得到第二同类公司交易模型;
用所述第二同类公司交易模型替换所述第一同类公司交易模型,作为所述第一交易模型。
可以理解的是,预设时间间隔前(如3年前、5年前)与待交易对象对应的交易对象公司的体量和业绩最接近的第二同类公司的第二同类公司历史交易数据和第二同类公司历史行情数据(可以得出其发展数据)对于价值投资来说具有重要的参考价值,本实施例中,利用所述第二同类公司历史交易数据和所述第二同类公司历史行情数据对所述第一同类公司交易模型进行修正,可以得到更合理的第二同类公司交易模型。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的装置,可通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如上述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性或其它的形式。
上述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
上述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例上述方法的全部或部分步骤。而前述的存储器包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储器中,存储器可以包括:闪存盘、只读存储器(英文:Read-Only Memory,简称:ROM)、随机存取器(英文:Random Access Memory,简称:RAM)、磁盘或光盘等。
以上对本申请实施例进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本申请的方法及其核心思想;同时,对于本领域的一般技术人员,依据本申请的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本申请的限制。
虽然本发明披露如上,但本发明并非限定于此。任何本领域技术人员,在不脱离本发明的精神和范围内,可轻易想到变化或替换,均可作各种更动与修改,包含上述不同功能、实施步骤的组合,包含软件和硬件的实施方式,均在本发明的保护范围。

Claims (10)

1.一种基于迁移学习优化的模拟撮合方法,其特征在于,包括:
获取待交易对象的第一特征数据;
根据所述第一特征数据得到所述待交易对象的多个关联对象;
获取所述多个关联对象的历史交易数据和历史行情数据;
根据所述第一特征数据和所述历史行情数据,基于迁移学习技术得到所述待交易对象的第一行情数据集和第二行情数据集;
根据所述第一行情数据集和第一神经网络得到第一行情数据模型;
根据所述第二行情数据集和第二神经网络得到第二行情数据模型;
利用所述历史交易数据和所述历史行情数据对第三神经网络进行训练得到第一交易模型;
获取当前行情数据;
将所述当前行情数据输入所述第一行情数据模型得第一当前行情数据;
将所述第一当前行情数据输入所述第二行情数据模型得到第二当前行情数据;
所述第一当前行情数据中的所述第二当前行情数据剔除,得到第三当前行情数据;
根据所述第三当前行情数据和所述第一交易模型得出模拟交易结果。
2.根据权利要求1所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述根据所述第一特征数据得到所述待交易对象的多个关联对象的步骤,包括:
对所述第一特征数据进行处理,基于不同维度生成多个特征数据集;
利用所述多个特征数据集和预先训练好的交易对象画像模型生成所述待交易对象的第一画像;
采集金融交易数据;
结合语义识别算法对所述金融交易数据进行处理,并利用所述第一画像和预先训练好的关系抽取模型得到所述多个关联对象。
3.根据权利要求2所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述根据所述第一特征数据和所述历史行情数据,基于迁移学习技术得到所述待交易对象的第一行情数据集和第二行情数据集的步骤,包括:
将所述历史行情数据分为训练集和测试集;
将所述训练集输入深度学习神经网络进行训练,得到第一历史行情数据模型;
利用所述测试集对所述第一历史行情模型进行测试,并根据测试结果对所述第一历史行情数据模型进行调整得到第二历史行情数据模型;
根据所述第一特征数据获取所述待交易对象的第一目标行情数据;
基于迁移学习技术,利用所述第一目标行情数据对所述第二历史行情数据模型进行调整,得到调整后的历史行情数据模型;
将所述历史行情数据输入所述历史行情数据模型,得到所述第一行情数据集;
从所述历史行情数据剔除所述第一行情数据集,得到与所述待交易对象不相关的所述第二行情数据集。
4.根据权利要求3所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述根据所述第二行情数据集和第二神经网络得到第二行情数据模型的步骤,包括:
将所述第二行情数据集分为训练集、验证集和测试集;
将所述训练集输入所述第二神经网络的输入层以提取训练语句特征;
将所述训练语句特征输入与所述输入层通过矩阵运算建立连接的所述第二神经网络的第一隐藏层;
所述第一隐藏层将所述训练语句特征进行合并,将合并后的训练语句特征进行特征向量的转变为特定的输出维度并利用第一激活函数进行激活得到第一输出数据;
将所述第一输出数据输入所述第二神经网络的模拟输出层;
所述模拟输出层将所述第一输出数据通过矩阵计算得出模拟输出值,并将所述模拟输出值输入所述第二隐藏层;
所述第二隐藏层将所述模拟输出值通过矩阵计算得出验证输出结果;
将所述测试集输入所述输入层以提取测试语句特征;
所述输入层将所述测试语句特征传输至所述第二隐藏层进行数据连接;
所述第二隐藏层将所述测试语句特征通过第二激活函数进行激活后,再通过矩阵计算得出第二输出数据,将所述第二输出数据与所述验证输出结果发送至所述第二神经网络的验证系数层进行验证得出正规化系数;
将所述正规化系数与所述模拟输出值发送至所述第二神经网络的输出层,所述输出层对所述模拟输出值进行正规化处理得到拟态结果;
根据所述拟态结果生成初始第二行情数据模型;
将所述验证集输入所述初始第二行情数据模型,得到正反馈数据和逆反馈数据;
根据所述正反馈数据和所述逆反馈数据对所述初始第二行情数据模型进行修正,生成所述第二行情数据模型。
5.根据权利要求4所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述获取所述多个关联对象的历史交易数据和历史行情数据的步骤,包括:
根据所述多个关联对象的名称和代码获取所述历史交易数据;
根据所述多个关联对象的名称、所属行业领域名称、所涉业务名称确定关键词数据;
基于词向量技术进行语义相似度分析以获取与所述关键词数据的词向量相似的衍生关键词数据;
根据所述关键词数据和所述衍生关键词数据获取相关的文本、音频、图像和视频作为原始历史行情数据;
对所述原始历史行情数据进行分析处理,得到所述历史行情数据。
6.根据权利要求5所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述根据所述第三当前行情数据和所述第一交易模型得出模拟交易结果的步骤,包括:
获取所述待交易对象的待交易对象历史交易数据;
根据所述第一行情数据和所述待交易对象历史交易数据对所述第一交易模型进行修改得到第二交易模型;
将所述第三当前行情数据输入所述第二交易模型,得到出模拟交易结果。
7.根据权利要求6所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述利用所述历史交易数据和所述历史行情数据对第三神经网络进行训练得到第一交易模型的步骤,包括:
根据所述第一特征数据确定所述待交易对象所属的行业领域;
从所述历史交易数据和所述历史行情数据提取出与所述行业领域对应的行业历史交易数据和行业历史行情数据;
将所述行业历史交易数据和所述行业历史行情数据输入所述第三神经网络进行训练得到行业交易模型;
将所述行业交易模型作为所述第一交易模型。
8.根据权利要求7所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述待交易对象为公司股票;所述将所述行业交易模型作为所述第一交易模型的步骤之后,还包括:
根据所述第一特征数据确定所述待交易对象的所有同类公司清单;
根据所述同类公司清单,从所述历史交易数据和所述历史行情数据提取出对应的同类公司历史交易数据和同类公司历史行情数据;
利用所述同类公司历史交易数据和所述同类公司历史行情数据对所述行业交易模型进行修正,得到同类公司交易模型;
用所述同类公司交易模型替换所述行业交易模型,作为所述第一交易模型。
9.根据权利要求8所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述用所述同类公司交易模型替换所述行业交易模型,作为所述第一交易模型的步骤之后,还包括:
根据所述同类公司清单,获取所有同类公司的年报数据以得到所述所有同类公司的同类公司体量数据和同类公司业绩数据;
获取所述待交易对象所属交易对象公司的年报数据以得到所述交易对象公司的交易对象公司体量数据和交易对象公司业绩数据;
将所述同类公司体量数据和所述同类公司业绩数据与所述交易对象公司体量数据和所述交易对象公司业绩数据进行比对分析,确定出与所述交易对象公司在体量和业绩方面最接近的第一同类公司;
从所述历史交易数据和所述历史行情数据提取出所述第一同类公司的第一同类公司历史交易数据和第一同类公司历史行情数据;
利用所述第一同类公司历史交易数据和所述第一同类公司历史行情数据对所述同类公司交易模型进行修正,得到第一同类公司交易模型;
用所述第一同类公司交易模型替换所述同类公司交易模型,作为所述第一交易模型。
10.根据权利要求6-9所述的基于迁移学习优化的模拟撮合方法,其特征在于,所述用所述第一同类公司交易模型替换所述同类公司交易模型,作为所述第一交易模型的步骤之后,还包括:
将所述同类公司体量数据和所述同类公司业绩数据与所述交易对象公司体量数据和所述交易对象公司业绩数据进行比对分析,确定出预设时间间隔前与所述交易对象公司在体量和业绩方面最接近的第二同类公司;
从所述历史交易数据和所述历史行情数据提取出所述第二同类公司的第二同类公司历史交易数据和第二同类公司历史行情数据;
利用所述第二同类公司历史交易数据和所述第二同类公司历史行情数据对所述第一同类公司交易模型进行修正,得到第二同类公司交易模型;
用所述第二同类公司交易模型替换所述第一同类公司交易模型,作为所述第一交易模型。
CN202310239636.0A 2023-03-03 基于迁移学习优化的模拟撮合方法 Active CN116228424B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310239636.0A CN116228424B (zh) 2023-03-03 基于迁移学习优化的模拟撮合方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310239636.0A CN116228424B (zh) 2023-03-03 基于迁移学习优化的模拟撮合方法

Publications (2)

Publication Number Publication Date
CN116228424A true CN116228424A (zh) 2023-06-06
CN116228424B CN116228424B (zh) 2024-06-04

Family

ID=

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050015323A1 (en) * 2003-07-03 2005-01-20 David Myr Machine learning automatic order transmission system for sending self-optimized trading signals
CN102214349A (zh) * 2011-06-13 2011-10-12 广东工业大学 一种无人值守的股票盯盘下单系统及其下单方法
CN110807704A (zh) * 2018-08-06 2020-02-18 江苏循环数据科技有限公司 一种智能期货量化交易方法及系统
CN113302644A (zh) * 2018-09-14 2021-08-24 元素人工智能公司 交易计划管理系统
CN113449923A (zh) * 2021-07-09 2021-09-28 中国银行股份有限公司 一种多模型标的物行情预测方法和装置
CN115080573A (zh) * 2022-08-19 2022-09-20 深圳星云智联科技有限公司 数据处理方法、装置、电子设备及存储介质
CN115168280A (zh) * 2022-08-30 2022-10-11 珠海星云智联科技有限公司 行情快照的处理方法及相关装置
CN115222538A (zh) * 2022-08-15 2022-10-21 深圳星云智联科技有限公司 行情快照数据计算方法、装置、电子设备和存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20050015323A1 (en) * 2003-07-03 2005-01-20 David Myr Machine learning automatic order transmission system for sending self-optimized trading signals
CN102214349A (zh) * 2011-06-13 2011-10-12 广东工业大学 一种无人值守的股票盯盘下单系统及其下单方法
CN110807704A (zh) * 2018-08-06 2020-02-18 江苏循环数据科技有限公司 一种智能期货量化交易方法及系统
CN113302644A (zh) * 2018-09-14 2021-08-24 元素人工智能公司 交易计划管理系统
CN113449923A (zh) * 2021-07-09 2021-09-28 中国银行股份有限公司 一种多模型标的物行情预测方法和装置
CN115222538A (zh) * 2022-08-15 2022-10-21 深圳星云智联科技有限公司 行情快照数据计算方法、装置、电子设备和存储介质
CN115080573A (zh) * 2022-08-19 2022-09-20 深圳星云智联科技有限公司 数据处理方法、装置、电子设备及存储介质
CN115168280A (zh) * 2022-08-30 2022-10-11 珠海星云智联科技有限公司 行情快照的处理方法及相关装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
孙达昌;毕秀春;: "基于深度学习算法的高频交易策略及其盈利能力", 中国科学技术大学学报, no. 11, pages 58 - 67 *

Similar Documents

Publication Publication Date Title
CN109829629B (zh) 风险分析报告的生成方法、装置、计算机设备和存储介质
TW201944305A (zh) 確定業務請求事件的風險機率的方法及裝置
CN110929043B (zh) 业务问题提取方法及装置
EP3494575B1 (en) Devices and methods for evaluating speech quality
CN107291775B (zh) 错误样本的修复语料生成方法和装置
JP2018025874A (ja) テキスト解析装置及びプログラム
CN106991312A (zh) 基于声纹识别的互联网反欺诈认证方法
Rashid et al. Towards zero-shot knowledge distillation for natural language processing
GB2521050A (en) Credit risk decision management system and method using voice analytics
CN114048729A (zh) 医学文献评价方法、电子设备、存储介质和程序产品
CN113240510A (zh) 异常用户预测方法、装置、设备及存储介质
CN113919437A (zh) 生成客户画像的方法、装置、设备及存储介质
Wang et al. Robust speaker identification of iot based on stacked sparse denoising auto-encoders
CN111723870B (zh) 基于人工智能的数据集获取方法、装置、设备和介质
CN116228424B (zh) 基于迁移学习优化的模拟撮合方法
CN107291686B (zh) 情感标识的辨识方法和情感标识的辨识系统
CN115329207B (zh) 智能销售信息推荐方法及系统
CN116228424A (zh) 基于迁移学习优化的模拟撮合方法
CN107886233B (zh) 客服的服务质量评价方法和系统
WO2018171499A1 (zh) 一种信息检测方法、设备及存储介质
CN115906797A (zh) 文本实体对齐方法、装置、设备及介质
CN112580348B (zh) 政策文本关联性分析方法及系统
CN109344388A (zh) 一种垃圾评论识别方法、装置及计算机可读存储介质
KR102341959B1 (ko) 문장 데이터의 감성 분석을 처리하는 시스템 및 방법
CN114969295A (zh) 基于人工智能的对话交互数据处理方法、装置及设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant