CN104318459A - 一种基于多模态学习的自动化市场分析方法 - Google Patents
一种基于多模态学习的自动化市场分析方法 Download PDFInfo
- Publication number
- CN104318459A CN104318459A CN201410629223.4A CN201410629223A CN104318459A CN 104318459 A CN104318459 A CN 104318459A CN 201410629223 A CN201410629223 A CN 201410629223A CN 104318459 A CN104318459 A CN 104318459A
- Authority
- CN
- China
- Prior art keywords
- market
- learning
- information
- parameter
- analysis method
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Abstract
本发明是一种基于多模态学习的自动化市场分析方法,先对学习装置进行训练,然后在实际使用中利用训练好的学习装置对市场进行预测;所述学习装置训练的方法为:首先采集市场的不同模态信息并对该信息进行标注;然后使用行情数据特征、文字特征的多示例生成方法将底层特征转换成为多示例包的形式;最后采用能够利用多种不同模态的多示例多标记学习方法对数据进行融合处理,进行多标记学习。本发明通过对市场的多个侧面信息进行获取,以更为全面的刻画市场的变动,能够更为准确的预测市场变化。利用多模态信息进行市场行情预测的方法,实施过程能够对不同模态的数据信息加以使用,适用性强,效果好。
Description
技术领域
在本发明属于自动化市场分析方法领域,具体地说是基于多模态学习的自动化市场分析方法。
背景技术
通过执行预先设定好的交易策略,利用计算机平台输入交易指令的算法交易已经成为目前主流的交易方式之一。考虑到市场微观结构的构成收到多种制约因素的限制,也即微观市场行情和多个不同的情报源相关。而目前的多数算法交易方法往往关注市场的一个侧面,例如价格或者相关新闻报道,仅仅考虑到单一因素,并且将其作为决定性因素加以考虑,这种方式导致了自动交易算法不能获取全面的市场信息,从而难以对市场的变化加以把握,这将导致市场变化预测的不准确,甚至对市场的变动作出错误的预测,进而使得风险提升。
发明内容
本发明要解决的技术问题是针对现有技术存在的不足,提出使用多模态学习技术对市场的多源制约因素加以后融合,进而提高预测准确度的基于多模态学习的自动化市场分析方法。
本发明所要解决的技术问题是通过以下的技术方案来实现的,本发明是一种基于多模态学习的自动化市场分析方法,其特点是,先对学习装置进行训练,然后在实际使用中利用训练好的学习装置对市场进行预测;所述学习装置训练的方法为:首先采集市场的不同模态信息并对该信息进行标注;然后使用行情数据特征、文字特征的多示例生成方法将底层特征转换成为多示例包的形式;最后采用能够利用多种不同模态的多示例多标记学习方法对数据进行融合处理,进行多标记学习。
本发明说的学习装置为支撑向量机SVM或者条件随机场CRF。
本发明一种基于多模态学习的自动化市场分析方法技术方案中,进一步优选的技术方案是:所述市场的不同模态信息为市场行情数据或市场描述文字信息。
本发明一种基于多模态学习的自动化市场分析方法技术方案中,进一步优选的技术方案是:所述学习装置训练的具体步骤如下:
A、收集市场的多种模态信息,对搜集的对象进行人工标注;
B、通过多示例生成方法将搜集的市场信息底层特征转化为多示例包的表示形式:{(x, t) , y},其中媒体对象标记为x,相应的其他模态信息记为t,人工标注标记为y;
C、使用训练模型M训练收集的数据,得到相关的模型参数:标记生成式子模型参数α、βy;市场直接行情特征模态信息生成子模型参数βc;其他模态信息生成式子模型参数βt以及多模态输入隐变量控制模型参数η。
本发明一种基于多模态学习的自动化市场分析方法技术方案中,进一步优选的技术方案是:学习装置的使用步骤如下:
a、收集测试市场行情数据特征;
b、通过多示例生成方法将市场行情的底层特征转化为多示例包的表示形式{(x)}或者{(x, t)};
c、使用训练模型M处理新市场特征I,输出预测标记y。
本发明一种基于多模态学习的自动化市场分析方法技术方案中,进一步优选的技术方案是:所述训练模型M的生成式概率模型建模方法为:
(1)令市场行情由主题模型生成,其中标记y由参数α通过Latent Dirichlet Allocation子模型和条件多项式分布参数βy生成;
(2)令α′由标记先验分布决定;
(3)令市场行情特征,即多示例包中的每个示例x都是由参数α′通过Latent Dirichlet Allocation参数η子模型和条件多项式分布参数βc生成;
(4)令其他模态特征t同样由参数α′通过Latent Dirichlet Allocation子模阶段型和条件多项式分布参数βt生成,即两种模态特征x和t的主题由同样的参数α′决定,并且如若其他模态也是多示例包表示,则包中每个示例都均由上述模型生成。
与现有技术相比,本发明通过对市场的多个侧面信息进行获取,以更为全面的刻画市场的变动,能够更为准确的预测市场变化。利用多模态学习技术对市场价格特征、新闻文字特征等多源信息进行融合,能够更为准确地对市场行情进行预测,提高算法交易策略的性能和准确度,降低风险,使其适用性强,效果好。
具体实施方式
以下进一步描述本发明的具体技术方案,以便于本领域的技术人员进一步地理解本发明,而不构成其权力的限制。
实施例1,一种基于多模态学习的自动化市场分析方法,先对学习装置进行训练,然后在实际使用中利用训练好的学习装置对市场进行预测;所述学习装置训练的方法为:首先采集市场行情数据或市场描述文字信息等的不同模态的信息并对该信息进行标注;然后使用行情数据特征、文字特征的多示例生成方法将底层特征转换成为多示例包的形式;最后采用能够利用多种不同模态的多示例多标记学习方法对数据进行融合处理,进行多标记学习。
实施例2,实施例1所述的基于多模态学习的自动化市场分析方法中:所述学习装置训练的具体步骤如下:
步骤100,收集市场的多种模态信息,对搜集的对象进行人工标注;
步骤101,通过多示例生成方法将搜集的市场信息底层特征转化为多示例包的表示形式:{(x, t) , y},其中媒体对象标记为x,相应的其他模态信息记为t,人工标注标记为y;
步骤102,使用训练模型M训练收集的数据,得到相关的模型参数:标记生成式子模型参数α、βy;市场直接行情特征模态信息生成子模型参数βc;其他模态信息生成式子模型参数βt以及多模态输入隐变量控制模型参数η。
所述训练模型M的生成式概率模型建模方法为:
(1)(标记-主题子模型部分) 令市场行情由主题模型生成,其中标记y由参数α通过Latent Dirichlet Allocation (LDA)子模型和条件多项式分布(参数βy)生成;
(2)令α′由标记先验分布决定;
(3)(标记-市场特征子模型部分)令市场行情特征,即多示例包中的每个示例x都是由参数α′通过Latent Dirichlet Allocation (LDA,参数η)子模型和条件多项式分布(参数βc)生成;
(4)(标记-其他模态特征子模型部分) 令其他模态特征t同样由参数α′通过Latent Dirichlet Allocation (LDA)子模阶段型和条件多项式分布(参数βt)生成,即两种模态特征x和t的主题由同样的参数α′决定,并且如若其他模态也是多示例包表示,则包中每个示例都均由上述模型生成。
实施例3,实施例1和实施例2所述的基于多模态学习的自动化市场分析方法中:所述学习装置训练的具体步骤如下:学习装置的使用步骤如下:
步骤200,收集测试市场行情数据特征(如果有其他模态的数据也进行收集);
步骤201,通过多示例生成方法将市场行情的底层特征转化为多示例包的表示形式{(x)}或者{(x, t)};
步骤202,使用训练模型M处理新市场特征I,输出预测标记y。
所述训练模型M的生成式概率模型建模方法为:
(1)(标记-主题子模型部分) 令市场行情由主题模型生成,其中标记y由参数α通过Latent Dirichlet Allocation (LDA)子模型和条件多项式分布(参数βy)生成;
(2)令α′由标记先验分布决定;
(3)(标记-市场特征子模型部分)令市场行情特征,即多示例包中的每个示例x都是由参数α′通过Latent Dirichlet Allocation (LDA,参数η)子模型和条件多项式分布(参数βc)生成;
(4)(标记-其他模态特征子模型部分) 令其他模态特征t同样由参数α′通过Latent Dirichlet Allocation (LDA)子模阶段型和条件多项式分布(参数βt)生成,即两种模态特征x和t的主题由同样的参数α′决定,并且如若其他模态也是多示例包表示,则包中每个示例都均由上述模型生成。
Claims (5)
1.一种基于多模态学习的自动化市场分析方法,其特征在于,先对学习装置进行训练,然后在实际使用中利用训练好的学习装置对市场进行预测;所述学习装置训练的方法为:首先采集市场的不同模态信息并对该信息进行标注;然后使用行情数据特征、文字特征的多示例生成方法将底层特征转换成为多示例包的形式;最后采用能够利用多种不同模态的多示例多标记学习方法对数据进行融合处理,进行多标记学习。
2.根据权利要求1所述的基于多模态学习的自动化市场分析方法,其特征在于,所述市场的不同模态信息为市场行情数据或市场描述文字信息。
3.根据权利要求1所述的基于多模态学习的自动化市场分析方法,其特征在于,所述学习装置训练的具体步骤如下:
A、收集市场的多种模态信息,对搜集的对象进行人工标注;
B、通过多示例生成方法将搜集的市场信息底层特征转化为多示例包的表示形式:{(x, t) , y},其中媒体对象标记为x,相应的其他模态信息记为t,人工标注标记为y;
C、使用训练模型M训练收集的数据,得到相关的模型参数:标记生成式子模型参数α、βy;市场直接行情特征模态信息生成子模型参数βc;其他模态信息生成式子模型参数βt以及多模态输入隐变量控制模型参数η。
4.根据权利要求1所述的基于多模态学习的自动化市场分析方法,其特征在于,学习装置的使用步骤如下:
a、收集测试市场行情数据特征;
b、通过多示例生成方法将市场行情的底层特征转化为多示例包的表示形式{(x)}或者{(x, t)};
c、使用训练模型M处理新市场特征I,输出预测标记y。
5.根据权利要求3或4所述的基于多模态学习的自动化市场分析方法,其特征在于,所述训练模型M的生成式概率模型建模方法为:
(1)令市场行情由主题模型生成,其中标记y由参数α通过Latent Dirichlet Allocation子模型和条件多项式分布参数βy生成;
(2)令α′由标记先验分布决定;
(3)令市场行情特征,即多示例包中的每个示例x都是由参数α′通过Latent Dirichlet Allocation参数η子模型和条件多项式分布参数βc生成;
(4)令其他模态特征t同样由参数α′通过Latent Dirichlet Allocation子模阶段型和条件多项式分布参数βt生成,即两种模态特征x和t的主题由同样的参数α′决定,并且如若其他模态也是多示例包表示,则包中每个示例都均由上述模型生成。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410629223.4A CN104318459B (zh) | 2014-11-11 | 2014-11-11 | 一种基于多模态学习的自动化市场分析方法 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201410629223.4A CN104318459B (zh) | 2014-11-11 | 2014-11-11 | 一种基于多模态学习的自动化市场分析方法 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN104318459A true CN104318459A (zh) | 2015-01-28 |
CN104318459B CN104318459B (zh) | 2017-07-11 |
Family
ID=52373686
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201410629223.4A Active CN104318459B (zh) | 2014-11-11 | 2014-11-11 | 一种基于多模态学习的自动化市场分析方法 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN104318459B (zh) |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104616180A (zh) * | 2015-03-09 | 2015-05-13 | 浪潮集团有限公司 | 一种热销商品预测方法 |
CN105631544A (zh) * | 2015-12-25 | 2016-06-01 | 苏州晨川通信科技有限公司 | 一种基于市场行情数据源的模型训练方法 |
CN105654116A (zh) * | 2015-12-25 | 2016-06-08 | 苏州晨川通信科技有限公司 | 一种利用市场行情数据源的合作预判方法 |
CN105654192A (zh) * | 2015-12-25 | 2016-06-08 | 苏州晨川通信科技有限公司 | 一种利用多来源数据的企业行情预测方法 |
CN107239787A (zh) * | 2016-03-29 | 2017-10-10 | 南京大学 | 一种利用多来源数据具有隐私保护功能的图象分类方法 |
CN110969216A (zh) * | 2019-12-20 | 2020-04-07 | 南京大学 | 基于多模态传感器数据的移动设备后台应用预测方法 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116893A (zh) * | 2013-03-15 | 2013-05-22 | 南京大学 | 基于多示例多标记学习的数字图像标注方法 |
CN103324940A (zh) * | 2013-05-02 | 2013-09-25 | 广东工业大学 | 基于多示例多标签学习的皮肤病理图片特征识别方法 |
-
2014
- 2014-11-11 CN CN201410629223.4A patent/CN104318459B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103116893A (zh) * | 2013-03-15 | 2013-05-22 | 南京大学 | 基于多示例多标记学习的数字图像标注方法 |
CN103324940A (zh) * | 2013-05-02 | 2013-09-25 | 广东工业大学 | 基于多示例多标签学习的皮肤病理图片特征识别方法 |
Non-Patent Citations (1)
Title |
---|
詹德川 等: "基于流形学习的多示例回归算法", 《计算机学报》 * |
Cited By (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104616180A (zh) * | 2015-03-09 | 2015-05-13 | 浪潮集团有限公司 | 一种热销商品预测方法 |
CN105631544A (zh) * | 2015-12-25 | 2016-06-01 | 苏州晨川通信科技有限公司 | 一种基于市场行情数据源的模型训练方法 |
CN105654116A (zh) * | 2015-12-25 | 2016-06-08 | 苏州晨川通信科技有限公司 | 一种利用市场行情数据源的合作预判方法 |
CN105654192A (zh) * | 2015-12-25 | 2016-06-08 | 苏州晨川通信科技有限公司 | 一种利用多来源数据的企业行情预测方法 |
CN107239787A (zh) * | 2016-03-29 | 2017-10-10 | 南京大学 | 一种利用多来源数据具有隐私保护功能的图象分类方法 |
CN110969216A (zh) * | 2019-12-20 | 2020-04-07 | 南京大学 | 基于多模态传感器数据的移动设备后台应用预测方法 |
Also Published As
Publication number | Publication date |
---|---|
CN104318459B (zh) | 2017-07-11 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN104318459A (zh) | 一种基于多模态学习的自动化市场分析方法 | |
Li et al. | Big data driven supply chain management | |
Hu et al. | The application of case-based reasoning in construction management research: An overview | |
CN103186457A (zh) | 一种自动生成测试用例的方法和装置 | |
CN110413786B (zh) | 基于网页文本分类的数据处理方法、智能终端及存储介质 | |
TW201947510A (zh) | 保險業務風險預測的處理方法、裝置及處理設備 | |
CN105447038A (zh) | 用于获取用户特征的方法和系统 | |
CN107679217A (zh) | 基于数据挖掘的关联内容提取方法和装置 | |
CN112925911B (zh) | 基于多模态数据的投诉分类方法及其相关设备 | |
TW201810093A (zh) | 使用者背景資訊的收集方法及裝置 | |
CN110909868A (zh) | 基于图神经网络模型的节点表示方法和装置 | |
CN104346751A (zh) | 一种半自动算法交易方法 | |
Hong et al. | Forecasting the net costs to organisations of Building Information Modelling (BIM) implementation at different levels of development (LOD). | |
CN113283222B (zh) | 自动化报表生成方法、装置、计算机设备及存储介质 | |
CN105335446A (zh) | 一种基于词矢量的短文本分类模型生成方法与分类方法 | |
Baliyan et al. | Towards software engineering paradigm for software as a service | |
CN104268698A (zh) | 一种对电网企业运营监测业务数据进行排名的方法 | |
US9514256B1 (en) | Method and system for modelling turbulent flows in an advection-diffusion process | |
CN116304236A (zh) | 一种用户画像生成方法、装置、电子设备和存储介质 | |
CN114997414B (zh) | 数据处理方法、装置、电子设备和存储介质 | |
CN103257861B (zh) | 一种自动生成bios代码的方法及装置 | |
CN114090601B (zh) | 一种数据筛选方法、装置、设备以及存储介质 | |
CN115393034A (zh) | 基于自然语言处理技术对企业账户进行风险识别的方法 | |
Asthana et al. | Joint time-series learning framework for maximizing purchase order renewals | |
CN104731819A (zh) | 广告关键词提取方法和装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant | ||
TR01 | Transfer of patent right | ||
TR01 | Transfer of patent right |
Effective date of registration: 20230829 Address after: Building 3, No. 55 Jinlin Road, Changshu High tech Industrial Development Zone, Suzhou City, Jiangsu Province, 215500 Patentee after: Suzhou Dazhi Tongrun IOT Technology Co.,Ltd. Address before: Room 412, Building 1, No. 68 Southeast Avenue, Changshu Southeast Economic Development Zone, Suzhou City, Jiangsu Province, 215533 Patentee before: SUZHOU CHENCHUAN COMMUNICATION TECHNOLOGY Co.,Ltd. |