CN116611696B - 一种基于时间序列分析的数字资产市场风险预测系统 - Google Patents
一种基于时间序列分析的数字资产市场风险预测系统 Download PDFInfo
- Publication number
- CN116611696B CN116611696B CN202310885775.0A CN202310885775A CN116611696B CN 116611696 B CN116611696 B CN 116611696B CN 202310885775 A CN202310885775 A CN 202310885775A CN 116611696 B CN116611696 B CN 116611696B
- Authority
- CN
- China
- Prior art keywords
- digital asset
- emotion
- market
- data
- social
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000012300 Sequence Analysis Methods 0.000 title claims abstract description 8
- 230000008451 emotion Effects 0.000 claims abstract description 106
- 238000004458 analytical method Methods 0.000 claims abstract description 34
- 238000007781 pre-processing Methods 0.000 claims abstract description 18
- 238000000034 method Methods 0.000 claims description 36
- 230000011218 segmentation Effects 0.000 claims description 24
- 230000006870 function Effects 0.000 claims description 16
- 230000036651 mood Effects 0.000 claims description 12
- 230000002159 abnormal effect Effects 0.000 claims description 8
- 238000003058 natural language processing Methods 0.000 claims description 8
- 238000005516 engineering process Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 4
- 239000003814 drug Substances 0.000 claims description 4
- 238000001514 detection method Methods 0.000 claims description 2
- 238000007619 statistical method Methods 0.000 claims description 2
- 230000001568 sexual effect Effects 0.000 claims 1
- 238000012731 temporal analysis Methods 0.000 description 6
- 238000000700 time series analysis Methods 0.000 description 6
- 238000010586 diagram Methods 0.000 description 3
- 230000007935 neutral effect Effects 0.000 description 3
- 230000002688 persistence Effects 0.000 description 3
- 230000001427 coherent effect Effects 0.000 description 2
- 238000007405 data analysis Methods 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004364 calculation method Methods 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013480 data collection Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 238000001914 filtration Methods 0.000 description 1
- 238000009499 grossing Methods 0.000 description 1
- 230000002085 persistent effect Effects 0.000 description 1
- 238000003672 processing method Methods 0.000 description 1
- 238000012954 risk control Methods 0.000 description 1
- 230000035945 sensitivity Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q10/00—Administration; Management
- G06Q10/06—Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
- G06Q10/063—Operations research, analysis or management
- G06Q10/0635—Risk analysis of enterprise or organisation activities
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2458—Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
- G06F16/2474—Sequence data queries, e.g. querying versioned data
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Business, Economics & Management (AREA)
- Human Resources & Organizations (AREA)
- Physics & Mathematics (AREA)
- Theoretical Computer Science (AREA)
- Development Economics (AREA)
- Economics (AREA)
- Entrepreneurship & Innovation (AREA)
- General Physics & Mathematics (AREA)
- Strategic Management (AREA)
- General Business, Economics & Management (AREA)
- Accounting & Taxation (AREA)
- Finance (AREA)
- Operations Research (AREA)
- Marketing (AREA)
- Game Theory and Decision Science (AREA)
- Technology Law (AREA)
- Educational Administration (AREA)
- Tourism & Hospitality (AREA)
- Quality & Reliability (AREA)
- Fuzzy Systems (AREA)
- Mathematical Physics (AREA)
- Probability & Statistics with Applications (AREA)
- Software Systems (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Databases & Information Systems (AREA)
- General Engineering & Computer Science (AREA)
- Management, Administration, Business Operations System, And Electronic Commerce (AREA)
Abstract
本发明提供了一种基于时间序列分析的数字资产市场风险预测系统,其特征在于,包括数据采集模块、数据处理模块、社会情感分析模块和风险预测模块;所述数据采集模块用于采集数字资产市场的数据信息;所述数据处理模块用于对所述数据信息进行预处理;所述社会情感分析模块用于对数字资产市场的社会情感进行分析获取市场情绪指标,所述风险预测模块用于根据所述数据信息和市场情绪指标对数字资产市场风险分析预测;本发明结合了时间序列分析模型、资产热度和公众情绪偏向程度对单数字资产和数字资产市场风险进行预测,更全面准确的完成了对数字资产市场内风险的预测。
Description
技术领域
本发明涉及数据分析技术领域,尤其涉及一种基于时间序列分析的数字资产市场风险预测系统。
背景技术
数字资产市场的波动性和风险性对投资者和市场参与者来说都是至关重要的关注点;预测数字资产市场的风险水平对于制定有效的投资策略、风险管理和资产配置至关重要;基于时间序列分析的数字资产市场风险预测系统旨在利用历史市场数据和先进的分析技术来预测数字资产市场的波动性和风险水平。
查阅相关已公开技术方案,如CN110796393A现有技术公开了一种基于持久同调的金融风险预警方法及其实现系统,包括步骤如下:(1)构建多维时间序列:(2)采用滑动窗口建立多维点云;(3)对于每个多维点云Uk,在欧式空间构造VR-复形过滤;(4)采用持久同调方法计算一维的持久图、持久峰群和L1范数;(5)根据求取的L1范数对金融风险进行预警;该方案采用债市指数、股市指数与汇率等多种指标分类联合建立VR复形序列,结合最新的大数据分析技术-持久同调方法,能准确、稳定地给出金融风险的早期预警信号,提高了金融风险控制能力、降低了金融风险;上述方案仅通过历史数据序列对金融风险预测预警,没有考虑到市场热度和市场情绪对金融风险的影响,所以对于金融风险预测的敏感性和准确性较低。
发明内容
本发明的目的在于,针对目前所存在的不足,提出了一种基于时间序列分析的数字资产市场风险预测系统。
本发明采用如下技术方案:
一种基于时间序列分析的数字资产市场风险预测系统,其特征在于,包括数据采集模块、数据处理模块、社会情感分析模块和风险预测模块;
所述数据采集模块用于采集数字资产市场的数据信息;所述数据处理模块用于对所述数据信息进行预处理;所述社会情感分析模块用于对数字资产市场的社会情感进行分析获取市场情绪指标,所述风险预测模块用于根据所述数据信息和市场情绪指标对数字资产市场风险分析预测;
所述数据采集模块通过各数据源的API接口采集数字资产市场的数据信息,所述数据信息包括包括数字资产市场中各数字资产的价格、交易量和社交新闻信息;所述数据源包括各数字资产平台和各社交新闻媒体;所述数据采集模块通过各数字资产平台获取各数字资产的价格和交易量,通过各社交新闻媒体获取各数字资产的社交新闻信息;
所述数据处理模块对于所述数据信息的预处理包括对各数字资产的价格和交易量进行以下方式的处理:
噪声处理:减少各数字资产价格和交易量的波动性和误差;
异常值处理:去除各数字资产价格和交易量数据中存在的异常值;
去重处理:去除各数字资产价格和交易量数据中的重复数据;
缺失值处理:填补各数字资产价格和交易量中带有时序性的缺失值;
进一步的,所述社会情感分析模块根据所述数据信息中的各数字资产的社交新闻信息对数字资产市场的社会情感进行分析获取市场情绪指标,所述市场情绪指标包括各数字资产的热度和公众情绪偏向程度,所述市场情绪指标的获取包括以下步骤:
S101:文本预处理:对获取的社交新闻信息进行文本预处理,包括文本清洗和去除停用词处理;
S102:通过下式计算各数字资产的热度:
;
其中,为某数字资产随当前时间变化的数字资产热度,/>表示当前时间,/>为社交新闻媒体的总数量,/>为第/>个社交新闻媒体的影响权重,可由用户根据各社交新闻媒体影响力自行设定,/>为第/>个社交新闻媒体中,以当前时间为截止时间的设定采集周期内的该数字资产文本出现次数,/>为第/>个社交新闻媒体中,以当前时间为截止时间的设定采集周期内总文本数量;
S103:在所述S101步骤预处理后的社交新闻信息中,提取出各数字资产相关数据,所述各数字资产相关数据为包含各数字资产名称文本的文章、报道、帖子、评论和提及;
S104:将各数字资产相关数据中文本进行分词处理生成分词结果,所述分词结果为词语或短语的序列,所述分词处理通过使用自然语言处理(NLP)技术中的分词工具或算法来实现;
S105:将分词结果作为预训练后的情感分析模型中的输入,所述情感分析模型通过对输入文本进行处理和学习,从而完成对于公众情绪偏向程度的预测;所述情感分析模型的输出为取值范围在内的连续值来代表公众情绪偏向程度;其中输出接近/>时,表示负面情绪的偏离程度较大,公众情绪更偏向于负面;当输出接近/>时,表示正面情绪的偏离程度较大,公众情绪更偏向于正面;输出接近/>的输出表示公众情绪偏向趋于中性;
进一步的,所述风险预测模块包括单数字资产风险预测模块和数字资产领域风险预测模块,所述单数字资产风险预测模块用于对各单独的数字资产风险进行预测;所述数字资产领域风险预测模块用于对各数字资产领域风险进行预测;
进一步的,所述单数字资产风险预测模块包括第一预测单元和第二预测单元,所述第一预测单元根据各数字资产价格的历史价格序列,通过GARCH模型对各数字资产的初始波动率进行预测;所述第二预测单元根据第一预测单元的预测结果、各数字资产热度和公众情绪偏向程度完成完成对各数字资产风险最终的预测;
所述第二预测单元对于各数字资产的最终预测满足下式:
;
其中,为某数字资产的最终波动率关于所预测的未来时间的函数;/>表示所要预测的未来时间;/>为热度影响因子,/>为公众情绪影响因子;/>为第一预测单元输出的关于预测的未来时间的初始波动率函数;
对于热度影响因子满足:
;
其中,为一用于收敛/>的极大自然数,可根据经验自行设定;
对于公众情绪影响因子满足:
;
其中,为当前时间的公众情绪偏向程度;通过具有时序性的所述情感分析模型的输出结果获得;
进一步的,所述数字资产领域风险预测模块对于各数字资产领域风险的预测满足下式:
;
其中,为某数字资产领域的波动率关于所预测的未来时间的函数,/>为该数字资产领域内第/>个数字资产的权重,/>为该数字资产领域内第/>个数字资产的最终波动率函数;
对于满足:
;
其中,为该数字资产领域内第/>个数字资产的交易量,/>为该数字资产领域内所有数字资产的总交易量。
本发明所取得的有益效果是:
本发明通过社会情感分析模块对社交新闻媒体上的社交新闻信息进行分析,从而获取公众对于各数字资产的关注度(热度)和情感倾向,这种情感分析可以提供更全面的市场参考,帮助预测市场风险;
通过GARCH模型根据各数字资产价格的历史价格序列来预测未来时间的各数字资产波动率,从而提高对数字资产风险的预测能力;
通过风险预测模块综合利用各数字资产价格的历史价格序列、热度和公众情绪偏向程度来对数字资产的波动率进行预测,综合了各方面的信息,更全面准确的完成了对数字资产风险的预测;
通过结合各数字资产的波动率与各数字资产的交易量对各数字资产领域风险进行分析,提供了更准确、全面的数字资产市场风险预测;有助于投资者、交易员和风险管理者更好地理解市场风险,做出相应的决策和调整策略。
附图说明
从以下结合附图的描述可以进一步理解本发明。图中的部件不一定按比例绘制,而是将重点放在示出实施例的原理上。在不同的视图中,相同的附图标记指定对应的部分。
图1为本发明整体模块示意图。
图2为本发明市场情绪指标的获取流程示意图。
图3为本发明对各数字资产的初始波动率的预测流程示意图。
图4为本发明基于时间序列分析的数字资产市场风险预测方法流程示意图。
具体实施方式
为了使得本发明的目的、技术方案及优点更加清楚明白,以下结合其实施例,对本发明进行进一步详细说明;应当理解,此处所描述的具体实施例仅用于解释本发明,并不用于限定本发明;对于本领域技术人员而言,在查阅以下详细描述之后,本实施例的其它系统、方法和/或特征将变得显而易见;旨在所有此类附加的系统、方法、特征和优点都包括在本说明书内;包括在本发明的范围内,并且受所附权利要求书的保护;在以下详细描述描述了所公开的实施例的另外的特征,并且这些特征根据以下将详细描述将是显而易见的。
本发明实施例的附图中相同或相似的标号对应相同或相似的部件;在本发明的描述中,需要理解的是,若有术语“上”、“下”、“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本发明和简化描述,而不是指示或暗示所指的装置或组件必须具有特定的方位,以特定的方位构造和操作,因此附图中描述位置关系的用语仅用于示例性说明,不能理解为对本专利的限制,对于本领域的普通技术人员而言,可以根据具体情况理解上述术语的具体含义。
实施例一:如图1、图2所示,本实施例提供一种基于时间序列分析的数字资产市场风险预测系统,其特征在于,包括数据采集模块、数据处理模块、社会情感分析模块和风险预测模块;
所述数据采集模块用于采集数字资产市场的数据信息;所述数据处理模块用于对所述数据信息进行预处理;所述社会情感分析模块用于对数字资产市场的社会情感进行分析获取市场情绪指标,所述风险预测模块用于根据所述数据信息和市场情绪指标对数字资产市场风险分析预测;
所述数据采集模块通过各数据源的API接口采集数字资产市场的数据信息,所述数据信息包括包括数字资产市场中各数字资产的价格、交易量和社交新闻信息;所述数据源包括各数字资产平台和各社交新闻媒体;所述数据采集模块通过各数字资产平台获取各数字资产的价格和交易量,通过各社交新闻媒体获取各数字资产的社交新闻信息;
所述数据处理模块对于所述数据信息的预处理包括对各数字资产的价格和交易量进行以下方式的处理:
噪声处理:减少各数字资产价格和交易量的波动性和误差;
异常值处理:去除各数字资产价格和交易量数据中存在的异常值;
去重处理:去除各数字资产价格和交易量数据中的重复数据;
缺失值处理:填补各数字资产价格和交易量中带有时序性的缺失值;
进一步的,所述社会情感分析模块根据所述数据信息中的各数字资产的社交新闻信息对数字资产市场的社会情感进行分析获取市场情绪指标,所述市场情绪指标包括各数字资产的热度和公众情绪偏向程度,所述市场情绪指标的获取包括以下步骤:
S101:文本预处理:对获取的社交新闻信息进行文本预处理,包括文本清洗和去除停用词处理;
S102:通过下式计算各数字资产的热度:
;
其中,为某数字资产随当前时间变化的数字资产热度,/>表示当前时间,/>为社交新闻媒体的总数量,/>为第/>个社交新闻媒体的影响权重,可由用户根据各社交新闻媒体影响力自行设定,/>为第/>个社交新闻媒体中,以当前时间为截止时间的设定采集周期内的该数字资产文本出现次数,/>为第/>个社交新闻媒体中,以当前时间为截止时间的设定采集周期内总文本数量;
S103:在所述S101步骤预处理后的社交新闻信息中,提取出各数字资产相关数据,所述各数字资产相关数据为包含各数字资产名称文本的文章、报道、帖子、评论和提及;
S104:将各数字资产相关数据中文本进行分词处理生成分词结果,所述分词结果为词语或短语的序列,所述分词处理通过使用自然语言处理(NLP)技术中的分词工具或算法来实现;
S105:将分词结果作为预训练后的情感分析模型中的输入,所述情感分析模型通过对输入文本进行处理和学习,从而完成对于公众情绪偏向程度的预测;所述情感分析模型的输出为取值范围在内的连续值来代表公众情绪偏向程度;其中输出接近/>时,表示负面情绪的偏离程度较大,公众情绪更偏向于负面;当输出接近/>时,表示正面情绪的偏离程度较大,公众情绪更偏向于正面;输出接近/>的输出表示公众情绪偏向趋于中性;
进一步的,所述风险预测模块包括单数字资产风险预测模块和数字资产领域风险预测模块,所述单数字资产风险预测模块用于对各单独的数字资产风险进行预测;所述数字资产领域风险预测模块用于对各数字资产领域风险进行预测;
进一步的,所述单数字资产风险预测模块包括第一预测单元和第二预测单元,所述第一预测单元根据各数字资产价格的历史价格序列,通过GARCH模型对各数字资产的初始波动率进行预测;所述第二预测单元根据第一预测单元的预测结果、各数字资产热度和公众情绪偏向程度完成完成对各数字资产风险最终的预测;
所述第二预测单元对于各数字资产的最终预测满足下式:
;
其中,为某数字资产的最终波动率关于所预测的未来时间的函数;/>表示所要预测的未来时间;/>为热度影响因子,/>为公众情绪影响因子;/>为第一预测单元输出的关于预测的未来时间的初始波动率函数;
对于热度影响因子满足:
;
其中,为一用于收敛/>的极大自然数,可根据经验自行设定;
对于公众情绪影响因子满足:
;
其中,为当前时间的公众情绪偏向程度;通过具有时序性的所述情感分析模型的输出结果获得;
进一步的,所述数字资产领域风险预测模块对于各数字资产领域风险的预测满足下式:
;
其中,为某数字资产领域的波动率关于所预测的未来时间的函数,/>为该数字资产领域内第/>个数字资产的权重,/>为该数字资产领域内第/>个数字资产的最终波动率函数;
对于满足:
;
其中,为该数字资产领域内第/>个数字资产的交易量,/>为该数字资产领域内所有数字资产的总交易量。
实施例二:本实施例应当理解为至少包含前述任一一个实施例的全部特征,并在其基础上进一步改进;
本实施例提供一种基于时间序列分析的数字资产市场风险预测系统,其特征在于,包括数据采集模块、数据处理模块、社会情感分析模块和风险预测模块;
所述数据采集模块用于采集数字资产市场的数据信息;所述数据处理模块用于对所述数据信息进行预处理;所述社会情感分析模块用于对数字资产市场的社会情感进行分析获取市场情绪指标,所述风险预测模块用于根据所述数据信息和市场情绪指标对数字资产市场风险分析预测;
所述数据采集模块通过各数据源的API接口采集数字资产市场的数据信息,所述数据信息包括包括数字资产市场中各数字资产的价格、交易量和社交新闻信息;所述数据源包括各数字资产平台和各社交新闻媒体;所述数据采集模块通过各数字资产平台获取各数字资产的价格和交易量,通过各社交新闻媒体获取各数字资产的社交新闻信息;
所述数据处理模块对于所述数据信息的预处理包括对各数字资产的价格和交易量进行以下方式的处理:
噪声处理:噪声是随机干扰引起的不必要的波动或误差;可使用常用的噪声处理方法,通过应用滑动平均、指数平滑或移动平均等技术,将数据的波动性降低,使其更平滑;从而减少各数字资产价格和交易量的波动性和误差;
异常值处理:异常值是与其他观测值显著不同的数据点;可通过基于统计方法的标准差或分位数的阈值检测,将异常值替换为缺失值或使用插值方法进行填充,或者完全移除异常值来处理异常值;从而去除各数字资产价格和交易量数据中存在的异常值;
去重处理:在数据收集过程中,可能会出现重复的价格数据;去重是指检测和删除数据集中的重复值;通过对数据进行去重操作,可以避免重复计算和分析,确保数据的唯一性和准确性,从而去除各数字资产价格和交易量数据中的重复数据;
缺失值处理:在获取的价格数据中,可能存在缺失值,即某些时间点或数据点没有可用的价格信息;对于缺失值,可以使用缺失值的前一个有效值、后一个有效值、均值、中值或通过回归模型预测缺失值;填补各数字资产价格和交易量中带有时序性的缺失值;
进一步的,所述社会情感分析模块根据所述数据信息中的各数字资产的社交新闻信息对数字资产市场的社会情感进行分析获取市场情绪指标,所述市场情绪指标包括各数字资产的热度和公众情绪偏向程度,所述市场情绪指标的获取包括以下步骤:
S101:文本预处理:对获取的社交新闻信息进行文本预处理,包括文本清洗和去除停用词处理;
S102:通过下式计算各数字资产的热度:
;
其中,为某数字资产随当前时间变化的数字资产热度,/>表示当前时间,/>为社交新闻媒体的总数量,/>为第/>个社交新闻媒体的影响权重,可由用户根据各社交新闻媒体影响力自行设定,/>为第/>个社交新闻媒体中,以当前时间为截止时间的设定采集周期内的该数字资产文本出现次数,/>为第/>个社交新闻媒体中,以当前时间为截止时间的设定采集周期内总文本数量;
S103:在所述S101步骤预处理后的社交新闻信息中,提取出各数字资产相关数据,所述各数字资产相关数据为包含各数字资产名称文本的文章、报道、帖子、评论和提及;
S104:将各数字资产相关数据中文本进行分词处理生成分词结果,所述分词结果为词语或短语的序列,所述分词处理通过使用自然语言处理(NLP)技术中的分词工具或算法来实现;
S105:将分词结果作为预训练后的情感分析模型中的输入,所述情感分析模型通过对输入文本进行处理和学习,从而完成对于公众情绪偏向程度的预测;所述情感分析模型的输出为取值范围在内的连续值来代表公众情绪偏向程度;其中输出接近/>时,表示负面情绪的偏离程度较大,公众情绪更偏向于负面;当输出接近/>时,表示正面情绪的偏离程度较大,公众情绪更偏向于正面;输出接近/>的输出表示公众情绪偏向趋于中性;
进一步的,所述风险预测模块包括单数字资产风险预测模块和数字资产领域风险预测模块,所述单数字资产风险预测模块用于对各单独的数字资产风险进行预测;所述数字资产领域风险预测模块用于对各数字资产领域风险进行预测;
进一步的,所述单数字资产风险预测模块包括第一预测单元和第二预测单元,所述第一预测单元根据各数字资产价格的历史价格序列,通过GARCH模型对各数字资产的初始波动率进行预测;所述第二预测单元根据第一预测单元的预测结果、各数字资产热度和公众情绪偏向程度完成完成对各数字资产风险最终的预测;
所述GARCH 模型是一种经典的时间序列模型,用于建模和预测金融资产的波动率;如图3所示,所述第一预测单元通过GARCH模型对各数字资产的初始波动率的预测包括以下步骤:
S201:获取各数字资产价格的历史价格序列;
S202:根据历史价格序列计算收益率序列;
S203:拟合GARCH模型:选择适当的GARCH模型(如GARCH(1,1)、GARCH(0,1)等),并利用收益率序列拟合该模型;在拟合过程中,模型参数会根据历史收益率序列进行估计;
S204:预测波动率:利用拟合好的GARCH模型,基于当前时间点的已知信息,预测未来时间点的波动率;
所述第二预测单元对于各数字资产的最终预测满足下式:
;
其中,为某数字资产的最终波动率关于所预测的未来时间的函数;/>表示所要预测的未来时间;/>为热度影响因子,/>为公众情绪影响因子;/>为第一预测单元输出的关于预测的未来时间的初始波动率函数;
对于热度影响因子满足:
;
其中,为一用于收敛/>的极大自然数,可根据经验自行设定;
对于公众情绪影响因子满足:
;
其中,为当前时间的公众情绪偏向程度;通过具有时序性的所述情感分析模型的输出结果获得;
进一步的,所述数字资产领域风险预测模块对于各数字资产领域风险的预测满足下式:
;
其中,为某数字资产领域的波动率关于所预测的未来时间的函数,/>为该数字资产领域内第/>个数字资产的权重,/>为该数字资产领域内第/>个数字资产的最终波动率函数;
对于满足:
;
其中,为该数字资产领域内第/>个数字资产的交易量,/>为该数字资产领域内所有数字资产的总交易量;
所述各数字资产领域包括但不限于加密货币、代币、数字证券、虚拟商品和游戏资产,所述各数字资产为各数字资产领域内不同种类的数字资产;通过对一种类别内的多种数字资产风险预测结果来对该类别的数字资产领域风险进行预测,可以获得更全面和综合的该类别的风险预测信息,有助于投资者更好地理解整个类别的风险水平,并根据需求制定相应的风险管理策略。
如图4所示,一种基于时间序列分析的数字资产市场风险预测方法,应用于一种基于时间序列分析的数字资产市场风险预测系统,所述方法包括以下步骤:
S1:获取数字资产市场的数据信息;
S2:对所述数据信息进行预处理,包括噪声处理、异常值处理、去重处理和缺失值处理;
S3:计算各数字资产的热度和公众情绪偏向程度;
S4:通过GARCH模型计算各数字资产的初始波动率;
S5:结合各数字资产的初始波动率、热度和公众情绪偏向程度计算各数字资产的最终波动率;
S6:结合各数字资产的交易量和最终波动率计算各数字资产领域的波动率。
以上所公开的内容仅为本发明的优选可行实施例,并非因此局限本发明的保护范围,所以凡是运用本发明说明书及附图内容所做的等效技术变化,均包含于本发明的保护范围内,此外,随着技术发展其中的元素可以更新的。
Claims (1)
1.一种基于时间序列分析的数字资产市场风险预测系统,其特征在于,包括数据采集模块、数据处理模块、社会情感分析模块和风险预测模块;
所述数据采集模块用于采集数字资产市场的数据信息;所述数据处理模块用于对所述数据信息进行预处理;所述社会情感分析模块用于对数字资产市场的社会情感进行分析获取市场情绪指标,所述风险预测模块用于根据所述数据信息和市场情绪指标对数字资产市场风险分析预测;
所述数据采集模块通过各数据源的API接口采集数字资产市场的数据信息,所述数据信息包括包括数字资产市场中各数字资产的价格、交易量和社交新闻信息;所述数据源包括各数字资产平台和各社交新闻媒体;所述数据采集模块通过各数字资产平台获取各数字资产的价格和交易量,通过各社交新闻媒体获取各数字资产的社交新闻信息;
所述数据处理模块对于所述数据信息的预处理包括对各数字资产的价格和交易量进行以下方式的处理:
噪声处理:减少各数字资产价格和交易量的波动性和误差;
异常值处理:去除各数字资产价格和交易量数据中存在的异常值;基于统计方法的标准差或分位数的阈值检测,将异常值替换为缺失值或使用插值方法进行填充;
去重处理:去除各数字资产价格和交易量数据中的重复数据;
缺失值处理:填补各数字资产价格和交易量中带有时序性的缺失值;使用缺失值的前一个有效值、后一个有效值、均值、中值或通过回归模型预测缺失值,填补各数字资产价格和交易量中带有时序性的缺失值;
所述风险预测模块包括单数字资产风险预测模块和数字资产领域风险预测模块,所述单数字资产风险预测模块用于对各单独的数字资产风险进行预测;所述数字资产领域风险预测模块用于对各数字资产领域风险进行预测;
所述单数字资产风险预测模块包括第一预测单元和第二预测单元,所述第一预测单元根据各数字资产价格的历史价格序列,通过GARCH模型对各数字资产的初始波动率进行预测;所述第二预测单元根据第一预测单元的预测结果、各数字资产热度和公众情绪偏向程度完成对各数字资产风险最终的预测;
所述第一预测单元通过GARCH模型对各数字资产的初始波动率的预测包括以下步骤:
S201:获取各数字资产价格的历史价格序列;
S202:根据历史价格序列计算收益率序列;
S203:拟合GARCH模型:选择适当的GARCH模型(如GARCH(1,1)、GARCH(0,1)等),并利用收益率序列拟合该模型;在拟合过程中,模型参数会根据历史收益率序列进行估计;
S204:预测波动率:利用拟合好的GARCH模型,基于当前时间点的已知信息,预测未来时间点的波动率;
所述第二预测单元对于各数字资产的最终预测满足下式:
;
其中,为某数字资产的最终波动率关于所预测的未来时间的函数;/>表示所要预测的未来时间;/>为热度影响因子,/>为公众情绪影响因子;/>为第一预测单元输出的关于预测的未来时间的初始波动率函数;
对于热度影响因子满足:
;
其中,为一用于收敛/>的极大自然数,可根据经验自行设定;
对于公众情绪影响因子满足:
;
其中,为当前时间的公众情绪偏向程度;通过具有时序性的情感分析模型的输出结果获得;
所述数字资产领域风险预测模块对于各数字资产领域风险的预测满足下式:
;
其中,为某数字资产领域的波动率关于所预测的未来时间的函数,/>为该数字资产领域内第/>个数字资产的权重,/>为该数字资产领域内第/>个数字资产的最终波动率函数;
对于满足:
;
其中,为该数字资产领域内第/>个数字资产的交易量,/>为该数字资产领域内所有数字资产的总交易量;
所述社会情感分析模块根据所述数据信息中的各数字资产的社交新闻信息对数字资产市场的社会情感进行分析获取市场情绪指标,所述市场情绪指标包括各数字资产的热度和公众情绪偏向程度,所述市场情绪指标的获取包括以下步骤:
S101:文本预处理:对获取的社交新闻信息进行文本预处理,包括文本清洗和去除停用词处理;
S102:通过下式计算各数字资产的热度:
;
其中,为某数字资产随当前时间变化的数字资产热度,/>表示当前时间,/>为社交新闻媒体的总数量,/>为第/>个社交新闻媒体的影响权重,可由用户根据各社交新闻媒体影响力自行设定,/>为第/>个社交新闻媒体中,以当前时间为截止时间的设定采集周期内的数字资产文本出现次数,/>为第/>个社交新闻媒体中,以当前时间为截止时间的设定采集周期内总文本数量;
S103:在S101步骤预处理后的社交新闻信息中,提取出各数字资产相关数据,所述各数字资产相关数据为包含各数字资产名称文本的文章、报道、帖子、评论和提及;
S104:将各数字资产相关数据中文本进行分词处理生成分词结果,所述分词结果为词语或短语的序列,所述分词处理通过使用自然语言处理(NLP)技术中的分词工具或算法来实现;
S105:将分词结果作为预训练后的情感分析模型中的输入,所述情感分析模型通过对输入文本进行处理和学习,从而完成对于公众情绪偏向程度的预测;所述情感分析模型的输出为取值范围在内的连续值来代表公众情绪偏向程度;其中输出接近/>时,表示负面情绪的偏离程度较大,公众情绪更偏向于负面;当输出接近/>时,表示正面情绪的偏离程度较大,公众情绪更偏向于正面;输出接近/>的输出表示公众情绪偏向趋于中性。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310885775.0A CN116611696B (zh) | 2023-07-19 | 2023-07-19 | 一种基于时间序列分析的数字资产市场风险预测系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310885775.0A CN116611696B (zh) | 2023-07-19 | 2023-07-19 | 一种基于时间序列分析的数字资产市场风险预测系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN116611696A CN116611696A (zh) | 2023-08-18 |
CN116611696B true CN116611696B (zh) | 2024-01-26 |
Family
ID=87685675
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310885775.0A Active CN116611696B (zh) | 2023-07-19 | 2023-07-19 | 一种基于时间序列分析的数字资产市场风险预测系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116611696B (zh) |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN118333632B (zh) * | 2024-06-12 | 2024-08-30 | 山东政信大数据科技有限责任公司 | 基于人工智能的国产化数据资产管理系统与方法 |
Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956770A (zh) * | 2016-05-03 | 2016-09-21 | 中国科学院大学 | 一种股市风险预测平台及其文本挖掘方法 |
CN106095777A (zh) * | 2016-05-26 | 2016-11-09 | 优品财富管理有限公司 | 基于大数据的预测证券市场多空情绪指标方法 |
CN107357860A (zh) * | 2017-06-30 | 2017-11-17 | 中山大学 | 一种基于新闻数据的个股情绪汇聚方法 |
CN107403017A (zh) * | 2017-08-09 | 2017-11-28 | 上海数旦信息技术有限公司 | 一种智能分析实时新闻对金融市场影响的方法 |
CN107515928A (zh) * | 2017-08-25 | 2017-12-26 | 百度在线网络技术(北京)有限公司 | 一种判断资产价格走势的方法、装置、服务器、存储介质 |
CN109583738A (zh) * | 2018-11-22 | 2019-04-05 | 第创业证券股份有限公司 | 一种用于债券风险控制的装置及方法 |
CN110309508A (zh) * | 2019-06-20 | 2019-10-08 | 苏州点对点信息科技有限公司 | 一种基于投资者情绪的vwap量化交易系统及方法 |
CN111291925A (zh) * | 2020-01-18 | 2020-06-16 | 武汉盛信鸿通科技有限公司 | 一种基于人工智能的金融市场预测及决策的系统、方法 |
CN115423499A (zh) * | 2022-07-28 | 2022-12-02 | 中国科学院深圳先进技术研究院 | 模型训练方法、价格预测方法、终端设备以及存储介质 |
CN115456793A (zh) * | 2022-09-06 | 2022-12-09 | 山东大学 | 一种用户投资决策的智能风险控制系统 |
-
2023
- 2023-07-19 CN CN202310885775.0A patent/CN116611696B/zh active Active
Patent Citations (10)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN105956770A (zh) * | 2016-05-03 | 2016-09-21 | 中国科学院大学 | 一种股市风险预测平台及其文本挖掘方法 |
CN106095777A (zh) * | 2016-05-26 | 2016-11-09 | 优品财富管理有限公司 | 基于大数据的预测证券市场多空情绪指标方法 |
CN107357860A (zh) * | 2017-06-30 | 2017-11-17 | 中山大学 | 一种基于新闻数据的个股情绪汇聚方法 |
CN107403017A (zh) * | 2017-08-09 | 2017-11-28 | 上海数旦信息技术有限公司 | 一种智能分析实时新闻对金融市场影响的方法 |
CN107515928A (zh) * | 2017-08-25 | 2017-12-26 | 百度在线网络技术(北京)有限公司 | 一种判断资产价格走势的方法、装置、服务器、存储介质 |
CN109583738A (zh) * | 2018-11-22 | 2019-04-05 | 第创业证券股份有限公司 | 一种用于债券风险控制的装置及方法 |
CN110309508A (zh) * | 2019-06-20 | 2019-10-08 | 苏州点对点信息科技有限公司 | 一种基于投资者情绪的vwap量化交易系统及方法 |
CN111291925A (zh) * | 2020-01-18 | 2020-06-16 | 武汉盛信鸿通科技有限公司 | 一种基于人工智能的金融市场预测及决策的系统、方法 |
CN115423499A (zh) * | 2022-07-28 | 2022-12-02 | 中国科学院深圳先进技术研究院 | 模型训练方法、价格预测方法、终端设备以及存储介质 |
CN115456793A (zh) * | 2022-09-06 | 2022-12-09 | 山东大学 | 一种用户投资决策的智能风险控制系统 |
Non-Patent Citations (1)
Title |
---|
基于文本挖掘的投资者情绪对股票市场的影响研究;袁媛;中国优秀硕士论文全文数据库(电子期刊)(第7期);全文 * |
Also Published As
Publication number | Publication date |
---|---|
CN116611696A (zh) | 2023-08-18 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN116611696B (zh) | 一种基于时间序列分析的数字资产市场风险预测系统 | |
CN109727446A (zh) | 一种用电数据异常值的识别与处理方法 | |
CN107679734A (zh) | 一种用于无标签数据分类预测的方法和系统 | |
CN110874674A (zh) | 一种异常检测方法、装置及设备 | |
CN110782349A (zh) | 一种模型训练方法和系统 | |
CN113554350A (zh) | 活跃度评估方法、装置、电子设备及计算机可读存储介质 | |
CN116203352A (zh) | 一种配电网的故障预警方法、装置、设备及介质 | |
CN116126642A (zh) | 信息处理方法、装置、设备及存储介质 | |
CN112215711B (zh) | 产品风险评估方法及装置 | |
CN113642727A (zh) | 神经网络模型的训练方法和多媒体信息的处理方法、装置 | |
CN115907837B (zh) | 基于机器学习的期货数据分析、风险预测方法及系统 | |
CN115048487B (zh) | 基于人工智能的舆情分析方法、装置、计算机设备及介质 | |
CN115034762A (zh) | 一种岗位推荐方法、装置、存储介质、电子设备及产品 | |
CN109711848A (zh) | 一种金融交易的匹配系统及其构建方法、匹配方法 | |
CN115409616A (zh) | 风险检测方法、装置、设备、存储介质及产品 | |
CN114676297A (zh) | 目标寻优方法、装置、电子设备及存储介质 | |
Tadphale et al. | Impact of News Sentiment on Foreign Exchange Rate Prediction | |
CN113706223A (zh) | 一种数据处理方法和装置 | |
CN113421154A (zh) | 基于控制图的信贷风险评估方法及系统 | |
Chang et al. | Short-Term Stock Price-Trend Prediction Using Meta-Learning | |
Li | Using machine learning forecasts movie revenue | |
Pavithra et al. | Correlational and sentimental analysis using LSTM to forecast stock price | |
Goverdhan et al. | Time Series Prediction: Comparative Study of ML Models in the Stock Market | |
Ataş et al. | Estimating the growth or depreciation on exchange rates using sentiment analysis method from social media comments | |
Sudhakar et al. | Optimizing Technical Parameters and Stock Price Prediction using: Linear Regressive MapReduce and Quasi-Newton Deep Learning |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |