CN113112299A - 一种贵金属价格趋势预测方法及装置 - Google Patents

一种贵金属价格趋势预测方法及装置 Download PDF

Info

Publication number
CN113112299A
CN113112299A CN202110416814.3A CN202110416814A CN113112299A CN 113112299 A CN113112299 A CN 113112299A CN 202110416814 A CN202110416814 A CN 202110416814A CN 113112299 A CN113112299 A CN 113112299A
Authority
CN
China
Prior art keywords
price trend
price
trend prediction
precious metal
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110416814.3A
Other languages
English (en)
Inventor
许璟亮
廖鸿存
皇甫晓洁
周魁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202110416814.3A priority Critical patent/CN113112299A/zh
Publication of CN113112299A publication Critical patent/CN113112299A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q30/00Commerce
    • G06Q30/02Marketing; Price estimation or determination; Fundraising
    • G06Q30/0201Market modelling; Market analysis; Collecting market data
    • G06Q30/0202Market predictions or forecasting for commercial activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/211Syntactic parsing, e.g. based on context-free grammar [CFG] or unification grammars
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Health & Medical Sciences (AREA)
  • Accounting & Taxation (AREA)
  • Strategic Management (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Evolutionary Computation (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Molecular Biology (AREA)
  • Biophysics (AREA)
  • Computing Systems (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Game Theory and Decision Science (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • General Business, Economics & Management (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种贵金属价格趋势预测方法及装置,可以应用于人工智能领域,方法包括:获取贵金属的当前价格数据;将当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果。本申请将获得的情感分类、舆情基本面分析结果和财经事件影响因子作为神经网络模型的训练样本,训练获得成熟的贵金属价格趋势预测模型,利用该贵金属价格趋势预测模型预测贵金属的未来价格走势实现了无需人工分析即可自动获取价格走势的技术效果,提升了市场判断效率和准确性,由于神经网络模型相比于人而言更加理性,因此得到的趋势预测结果比人工分析结果更加准确,更加贴合实际情况。

Description

一种贵金属价格趋势预测方法及装置
技术领域
本申请属于自然语言处理技术领域,具体地讲,涉及一种贵金属价格趋势预测方法及装置。
背景技术
贵金属作为重要的金融产品需要对其价格走势进行辅助判断。目前缺少行之有效的价格趋势判断方法,只能依靠业务人员自身的经验分析。当前现有的通过舆情分析实现价格趋势预测的方法往往只是通过单一模型进行关联关系构建,预测模型整体的可解释性、运行效率和预测准确度都未能满足实际业务需求。
发明内容
本申请提供了一种贵金属价格趋势预测方法及装置,以至少解决当前通过单一模型预测产品价格趋势所产生的准确度低、运行效率低的问题。
为了解决上述技术问题,本申请提供以下技术方案:
根据本申请的第一方面,提供了一种贵金属价格趋势预测方法,包括:
获取贵金属的当前价格数据;
将当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果;价格趋势预测模型为MLP神经网络模型;
价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。
在一实施例中,价格趋势预测模型的训练方法包括:
将获取的财经新闻数据转化为词向量、句向量和文本向量;
根据词向量、句向量和文本向量获得舆情基本面系数;
根据贵金属的历史价格数据建立经验分布函数获得经验系数;
根据舆情基本面系数及经验系数生成训练样本集合;
利用训练样本集合对MLP神经网络模型进行训练,以预测价格趋势为训练目标,获得价格趋势预测模型。
在一实施例中,将获取的财经新闻数据转化为词向量、句向量和文本向量,包括:
通过词向量相关模型对财经新闻数据进行分词并获得词向量;
通过无监督算法将财经新闻数据分解转化为句向量;
对财经新闻数据进行累加归一计算,获得文本向量。
在一实施例中,根据词向量、句向量和文本向量获得舆情基本面系数,包括:
从词向量、句向量和文本向量中确定情感对象,并通过段落语法分析获得财经新闻数据中的情感基本面类型;
根据情感基本面类型计算该情感对象的舆情基本面系数。
在一实施例中,根据所述情感基本面类型计算该情感对象的舆情基本面系数,包括:
识别所述情感基本面类型中描述基本情感和市场情感的关键词;
根据描述基本情感的关键词计算基础得分;
根据描述市场情感的关键词计算修饰符得分;
将所述基础得分和所述修饰符得分相加获得舆情基本面系数。
在一实施例中,利用训练样本集合对MLP神经网络模型进行训练,包括:
将训练样本集合中的部分舆情基本面系数和部分经验系数作为输入信号输入至MLP神经网络模型;
以贵金属市场价格走势作为MLP神经网络模型的训练目标进行训练;
将剩余舆情基本面系数和剩余经验系数作为模型验证数据验证训练后的模型。
在一实施例中,将剩余所述舆情基本面系数和剩余所述经验系数作为模型验证数据验证训练后的模型,包括:
将剩余所述舆情基本面系数和剩余所述经验系数输入训练后的模型中获得输出结果;
验证输出结果和实际结果是否一致,并根据验证结果确定是否对模型进行继续训练。
根据本申请的第二个方面,还提供了一种贵金属价格趋势预测装置,包括:
当前价格数据获取单元,用于获取贵金属的当前价格数据;
价格趋势预测单元,用于将当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果;价格趋势预测模型为MLP神经网络模型;价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。
在一实施例中,贵金属价格趋势预测装置还包括一价格趋势预测模型的训练装置,包括:
向量转化单元,用于将获取的财经新闻数据转化为词向量、句向量和文本向量;
舆情基本系数获取单元,用于根据词向量、句向量和文本向量获得舆情基本面系数;
经验系数获取单元,用于根据贵金属的历史价格数据建立经验分布函数获得经验系数;
训练样本生成单元,用于根据舆情基本面系数及经验系数生成训练样本集合;
训练单元,用于利用训练样本集合对MLP神经网络模型进行训练,以预测价格趋势为训练目标,获得价格趋势预测模型。
在一实施例中,向量转化单元包括:
词向量获取模块,用于通过词向量相关模型对财经新闻数据进行分词并获得词向量;
句向量转化模块,用于通过无监督算法将财经新闻数据分解转化为句向量;
文本向量获取模块,用于对财经新闻数据进行累加归一计算,获得文本向量。
在一实施例中,舆情基本系数获取单元包括:
情感确定模块,用于从词向量、句向量和文本向量中确定情感对象,并通过段落语法分析获得财经新闻数据中的情感基本面类型;
计算模块,用于根据情感基本面类型计算该情感对象的舆情基本面系数。
在一实施例中,训练样本生成单元包括:
输入模块,用于将训练样本集合中的部分舆情基本面系数和部分经验系数作为输入信号输入至MLP神经网络模型;
目标训练模块,用于以贵金属市场价格走势作为MLP神经网络模型的训练目标进行训练;
验证模块,用于将剩余舆情基本面系数和剩余经验系数作为模型验证数据验证训练后的模型。
根据本申请的第三方面,提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现所述的贵金属价格趋势预测方法。
根据本申请的第四方面,提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现所述的贵金属价格趋势预测方法。
由上述技术方案可知,本申请提供的一种贵金属价格趋势预测方法及装置,方法包括:获取贵金属的当前价格数据;将当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果;价格趋势预测模型为MLP神经网络模型;价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。通过自然语言处理技术从财经新闻中提取贵金属的价格信号,然后从财经新闻中提取情感对象并对情感对象进行分类,明确了所要分析的目标。通过分析新闻中的舆情,判断该情感对象的舆情风向,舆情对于情感对象的评价是偏向积极性的还是偏向消极性的,实现了对于新闻舆情的准确分析和判断,有利于后续对情感对象进行整体价值评估。接下来对发生的财经事件进行分析,由于贵金属价格具有很强的顺周期特性,因此,根据贵金属的历史价格走势可以获得经验分布函数,从而获得财经事件对于贵金属价格的影响因子,实现了科学判断影响贵金属价格的条件并量化其对贵金属价格影响程度的功能。最后,根据上述获得的情感分类、舆情基本面分析结果和财经事件影响因子作为神经网络模型的训练样本,训练获得成熟的贵金属价格趋势预测模型,利用该贵金属价格趋势预测模型预测贵金属的未来价格走势实现了无需人工分析即可自动获取价格走势的技术效果,提升了市场判断效率和准确性,同时,由于神经网络模型相比于人而言更加理性,不会被感性因素所影响,因此得到的趋势预测结果比人工分析结果更加准确,更加贴合实际情况。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本申请提供的一种贵金属价格趋势预测方法流程图。
图2为本申请实施例中价格趋势预测模型的训练方法流程图。
图3为本申请实施例中向量转化的流程图。
图4为本申请实施例中Word2vec算法的层次结构图。
图5为doc2vec算法的层次结构图。
图6为本申请实施例中获得舆情基本面系数的方法流程图。
图7为本申请实施例中利用训练样本集合对MLP神经网络模型进行训练的方法流程图。
图8为本申请提供的一种贵金属价格趋势预测装置的结构框图。
图9为本申请实施例中价格趋势预测模型的训练装置的结构框图。
图10为本申请实施例中向量转化单元的结构框图。
图11为本申请实施例中舆情基本系数获取单元的结构框图。
图12为本申请实施例中训练样本生成单元的结构框图。
图13为本申请实施例中一种电子设备的具体实施方式。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,本申请公开的贵金属价格趋势预测方法及装置可以应用于人工智能领域,也可用于除人工智能领域之外的其他领域,本申请公开的贵金属价格趋势预测方法及装置的应用领域不做限定。
贵金属作为重要的金融产品需要对其价格走势进行辅助判断。目前缺少行之有效的价格趋势判断方法,只能依靠业务人员自身的经验分析。当前现有的通过舆情分析实现价格趋势预测的方法往往只是通过单一模型进行关联关系构建,预测模型整体的可解释性、运行效率和预测准确度都未能满足实际业务需求。
基于此,目前,金融产品的价格趋势还是主要依赖于交易员的经验,但是,由于交易员容易受到非理性因素的影响,容易造成对金融产品未来价格的误判,为了避免这种对于人的高度依赖,本申请分别提供了一种贵金属价格趋势预测方法、贵金属价格趋势预测装置、电子设备和计算机可读存储介质,通过自然语言处理技术从财经新闻中提取贵金属的价格信号,然后从财经新闻中提取情感对象并对情感对象进行分类,明确了所要分析的目标。通过分析新闻中的舆情,判断该情感对象的舆情风向,舆情对于情感对象的评价是偏向积极性的还是偏向消极性的,实现了对于新闻舆情的准确分析和判断,有利于后续对情感对象进行整体价值评估。接下来对发生的财经事件进行分析,由于贵金属价格具有很强的顺周期特性,因此,根据贵金属的历史价格走势可以获得经验分布函数,从而获得财经事件对于贵金属价格的影响因子,实现了科学判断影响贵金属价格的条件并量化其对贵金属价格影响程度的功能。最后,根据上述获得的情感分类、舆情基本面分析结果和财经事件影响因子作为神经网络模型的训练样本,训练获得成熟的贵金属价格趋势预测模型,利用该贵金属价格趋势预测模型预测贵金属的未来价格走势实现了无需人工分析即可自动获取价格走势的技术效果,提升了市场判断效率和准确性,同时,由于神经网络模型相比于人而言更加理性,不会被感性因素所影响,因此得到的趋势预测结果比人工分析结果更加准确,更加贴合实际情况。
基于上述内容,本申请还提供一种用于实现本申请一个或多个实施例中提供的贵金属价格趋势预测方法的贵金属价格趋势预测装置,该装置可以自行或通过第三方服务器等与客户端设备之间通信连接,以接收各个客户端设备发送的贵金属当前价格信息和相关新闻,并根据贵金属当前价格信息和相关新闻对未来的价格走势进行预测,并将预测结果返回给客户端,以使交易员能够根据客户端设备显示的价格预测结果快速作出判断和行动,进而能够提高对产品价格走势的判断准确性及效率。
可以理解的是,所述客户端设备可以包括智能手机、平板电子设备、网络机顶盒、便携式计算机、台式电脑、个人数字助理(PDA)、车载设备、智能穿戴设备等。其中,所述智能穿戴设备可以包括智能眼镜、智能手表、智能手环等。
在另一种实际应用情形中,前述的贵金属价格趋势预测装置进行贵金属价格趋势预测的部分可以在如上述内容的服务器中执行,也可以所有的操作都在所述客户端设备中完成。具体可以根据所述客户端设备的处理能力,以及用户使用场景的限制等进行选择。本申请对此不作限定。若所有的操作都在所述客户端设备中完成,所述客户端设备还可以包括处理器,用于贵金属价格趋势预测的具体处理。
上述的客户端设备可以具有通信模块(即通信单元),可以与远程的服务器进行通信连接,实现与所述服务器的数据传输。所述服务器可以包括任务调度中心一侧的服务器,其他的实施场景中也可以包括中间平台的服务器,例如与任务调度中心服务器有通信链接的第三方服务器平台的服务器。所述的服务器可以包括单台计算机设备,也可以包括多个服务器组成的服务器集群,或者分布式装置的服务器结构。
上述服务器与所述客户端设备之间可以使用任何合适的网络协议进行通信,包括在本申请提交日尚未开发出的网络协议。所述网络协议例如可以包括TCP/IP协议、UDP/IP协议、HTTP协议、HTTPS协议等。当然,所述网络协议例如还可以包括在上述协议之上使用的RPC协议(Remote Procedure Call Protocol,远程过程调用协议)、REST协议(Representational State Transfer,表述性状态转移协议)等。
具体通过下述各个实施例及应用实例分别进行详细说明。
为了提升对于贵金属价格未来走势预测的准确性,排除对于交易员经验的依赖,本申请供了一种贵金属价格趋势预测方法,如图1所示,包括:
S101:获取贵金属的当前价格数据。
S102:将当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果。价格趋势预测模型为MLP神经网络模型。
价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。
在S101的一种实现方式中,可以由交易员触发本申请实施例提供的贵金属价格趋势预测过程,具体可以为:接收客户端设备发送的由交易员上传的贵金属当前价格数据和贵金属价格相关新闻。
在S102的一种实现方式中,当获取了贵金属的当前价格数据和相关财经新闻后,将其输入至预先训练好的价格趋势预测模型中即可自动获得贵金属的价格趋势预测结果。
图1所述方法的执行主体可以为PC、计算机等,本申请提供的贵金属价格趋势预测方法,通过自然语言处理技术对财经新闻进行提取,并用提取后的结果训练神经网络模型,以价格趋势预测作为训练目的,将训练好的神经网络模型应用于实际中,只需将当前信息输入神经网络模型中即可获得价格趋势预测结果,排除了对于交易员经验的依赖并且可以不受感性因素影响理性地获得更为准确的价格预测结果。
在本申请中,如图2所示,价格趋势预测模型的训练方法包括:
S201:将获取的财经新闻数据转化为词向量、句向量和文本向量。
S202:根据词向量、句向量和文本向量获得舆情基本面系数。
S203:根据贵金属的历史价格数据建立经验分布函数获得经验系数。
S204:根据舆情基本面系数及经验系数生成训练样本集合。
S205:利用训练样本集合对MLP神经网络模型进行训练,以预测价格趋势为训练目标,获得价格趋势预测模型。
本申请提供的价格趋势预测模型训练方法通过分析新闻中的舆情,判断该情感对象的舆情风向,舆情对于情感对象的评价是偏向积极性的还是偏向消极性的,实现了对于新闻舆情的准确分析和判断,有利于后续对情感对象进行整体价值评估。接下来对发生的财经事件进行分析,由于贵金属价格具有很强的顺周期特性,因此,根据贵金属的历史价格走势可以获得经验分布函数,从而获得财经事件对于贵金属价格的影响因子,实现了科学判断影响贵金属价格的条件并量化其对贵金属价格影响程度的功能。最后,根据上述获得的情感分类、舆情基本面分析结果和财经事件影响因子作为神经网络模型的训练样本,训练获得成熟的贵金属价格趋势预测模型。利用该价格趋势预测模型预测得到的金属价格与实际价格走势吻合度更高。
在一实施例中,将获取的财经新闻数据转化为词向量、句向量和文本向量,如图3所示,具体包括如下内容:
S301:通过词向量相关模型对财经新闻数据进行分词并获得词向量。
S302:通过无监督算法将财经新闻数据分解转化为句向量。
S303:对财经新闻数据进行累加归一计算,获得文本向量。
在一具体实施例中,针对财经新闻中具体的情感分析可以采用Word2vec算法和doc2vec算法,通过上述两种算法实现财经新闻的分析和矢量化转换(图4为Word2vec算法的层次结构图,图5为doc2vec算法的层次结构图)。
例如,对新闻文本进行分句并进行情感分析,新闻文本为“黄金预计进入大牛市。”
将该新闻文本进行word2vec计算,分词并获得的词向量如下:
“黄金”:vector1(向量1)
“语句”:vector2(向量2)
“进入”:vector3(向量3)
“大牛市”:vector4(向量4)
再利用doc2vec算法进行计算,获得综合句向量如下:
黄金进入大牛市:vector5(向量5)
对新闻文本进行累加并采用归一算法计算,获得文本向量如下:
“2020-09-26黄金分析--新浪财经”:vector6(向量6)
在一实施例中,如图6所示,根据词向量、句向量和文本向量获得舆情基本面系数,包括:
S601:从词向量、句向量和文本向量中确定情感对象,并通过段落语法分析获得财经新闻数据中的情感基本面类型。
S602:根据情感基本面类型计算该情感对象的舆情基本面系数。
在一具体实施例中,情基本面采取“基本情感”、“市场情感”、“资产类特色情感”三大类32个指标维度,相关维度如下表1所示:
表1
Figure BDA0003026261310000091
通过段落语法分析,实现财经新闻到舆情基本面系数。
在一具体实施例中,以一段文本举例:
“这无疑是一个悲观的发展,原油在去年连续三个月的下行中出现过类似的情况,在月日时价格大幅走低。”
分离流程:
1、能源大类主体识别为原油。如对于企业则使用dov2vec识别关联匹配。
2、基础情感识别,使用dov2vec识别到悲观命中基础情感的“悲观”基本面。进行基础得分1。
3、市场情感识别,使用词典分析法命中“价格“基本面,”大幅”修饰符得分乘以2,“走低”修饰符得分反转。
获得的分析结果如下表2所示:
表2
日期 来源 资产标的 情感变量 分数
2019/5/29 hexun.com 原油 悲观 1
2019/5/29 hexun.com 原油 价格 -2
然后根据舆情基本面在当日所有文章中出现的次数来计算各舆情基本面系数,例如热度代表当日所有文章中讨论该资产的文章的比例,对所有数据进行归一化处理,保证指标维度均在-1到1之间。
在一具体实施例中,针对财经事件的分析,由于原油具有很强的顺周期性以及政治敏感性,与外汇有一定的类似性。根据概率论中的大数定律,可以证明当数据量趋近于正无穷的时候,经验分布函数趋向于真正的分布函数。财经事件分析跟据分布函数计算“财经事件”带来的经验系数。
在一实施例中,利用训练样本集合对MLP神经网络模型进行训练,如图7所示,包括:
S701:将训练样本集合中的部分舆情基本面系数和部分经验系数作为输入信号输入至MLP神经网络模型。
S702:以贵金属市场价格走势作为MLP神经网络模型的训练目标进行训练。
S703:将剩余舆情基本面系数和剩余经验系数作为模型验证数据验证训练后的模型。
在一具体实施例中,对情感分类、舆情基本面、财经事件分析后的舆情基本面系数和经验系数作为训练样本,并将训练样本中80%的数据作为MLP神经网络模型的输入信号,使用市场价格走势作为训练目标,剩余20%的数据用于验证该模型。
本申请所提供的方法通过自然语言处理技术从财经新闻中提取贵金属的价格信号,然后从财经新闻中提取情感对象并对情感对象进行分类,明确了所要分析的目标。通过分析新闻中的舆情,判断该情感对象的舆情风向,舆情对于情感对象的评价是偏向积极性的还是偏向消极性的,实现了对于新闻舆情的准确分析和判断,有利于后续对情感对象进行整体价值评估。接下来对发生的财经事件进行分析,由于贵金属价格具有很强的顺周期特性,因此,根据贵金属的历史价格走势可以获得经验分布函数,从而获得财经事件对于贵金属价格的影响因子,实现了科学判断影响贵金属价格的条件并量化其对贵金属价格影响程度的功能。最后,根据上述获得的情感分类、舆情基本面分析结果和财经事件影响因子作为神经网络模型的训练样本,训练获得成熟的贵金属价格趋势预测模型,利用该贵金属价格趋势预测模型预测贵金属的未来价格走势实现了无需人工分析即可自动获取价格走势的技术效果,提升了市场判断效率和准确性,同时,由于神经网络模型相比于人而言更加理性,不会被感性因素所影响,因此得到的趋势预测结果比人工分析结果更加准确,更加贴合实际情况。
从软件层面来说,为了避免当前价格趋势预测对于人的高度依赖,本申请还提供了一种用于执行所述贵金属价格趋势预测方法中全部或部分内容的贵金属价格趋势预测装置的实施例,如图8所示,所述贵金属价格趋势预测装置具体包括如下内容:
当前价格数据获取单元801,用于获取贵金属的当前价格数据;
价格趋势预测单元802,用于将当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果;价格趋势预测模型为MLP神经网络模型;价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。
在当前价格数据获取单元801的一种实现方式中,可以由交易员触发本申请实施例提供的贵金属价格趋势预测过程,具体可以为:接收客户端设备发送的由交易员上传的贵金属当前价格数据和贵金属价格相关新闻。
在当前价格数据获取单元801的一种实现方式中,当获取了贵金属的当前价格数据和相关财经新闻后,将其输入至预先训练好的价格趋势预测模型中即可自动获得贵金属的价格趋势预测结果。
本申请提供的贵金属价格趋势预测装置通过自然语言处理技术对财经新闻进行提取,并用提取后的结果训练神经网络模型,以价格趋势预测作为训练目的,将训练好的神经网络模型应用于实际中,只需将当前信息输入神经网络模型中即可获得价格趋势预测结果,排除了对于交易员经验的依赖并且可以不受感性因素影响理性地获得更为准确的价格预测结果。
在一实施例中,贵金属价格趋势预测装置还包括一价格趋势预测模型的训练装置,如图9所示,包括:
向量转化单元901,用于将获取的财经新闻数据转化为词向量、句向量和文本向量;
舆情基本系数获取单元902,用于根据词向量、句向量和文本向量获得舆情基本面系数;
经验系数获取单元903,用于根据贵金属的历史价格数据建立经验分布函数获得经验系数;
训练样本生成单元904,用于根据舆情基本面系数及经验系数生成训练样本集合;
训练单元905,用于利用训练样本集合对MLP神经网络模型进行训练,以预测价格趋势为训练目标,获得价格趋势预测模型。
本申请提供的价格趋势预测模型训练装置通过分析新闻中的舆情,判断该情感对象的舆情风向,舆情对于情感对象的评价是偏向积极性的还是偏向消极性的,实现了对于新闻舆情的准确分析和判断,有利于后续对情感对象进行整体价值评估。接下来对发生的财经事件进行分析,由于贵金属价格具有很强的顺周期特性,因此,根据贵金属的历史价格走势可以获得经验分布函数,从而获得财经事件对于贵金属价格的影响因子,实现了科学判断影响贵金属价格的条件并量化其对贵金属价格影响程度的功能。最后,根据上述获得的情感分类、舆情基本面分析结果和财经事件影响因子作为神经网络模型的训练样本,训练获得成熟的贵金属价格趋势预测模型。利用该价格趋势预测模型预测得到的金属价格与实际价格走势吻合度更高。
在一实施例中,如图10所示,向量转化单元901包括:
词向量获取模块1001,用于通过词向量相关模型对财经新闻数据进行分词并获得词向量;
句向量转化模块1002,用于通过无监督算法将财经新闻数据分解转化为句向量;
文本向量获取模块1003,用于对财经新闻数据进行累加归一计算,获得文本向量。
在一具体实施例中,针对财经新闻中具体的情感分析可以采用Word2vec算法和doc2vec算法,通过上述两种算法实现财经新闻的分析和矢量化转换。
在一实施例中,如图11所示,舆情基本系数获取单元902包括:
情感确定模块1101,用于从词向量、句向量和文本向量中确定情感对象,并通过段落语法分析获得财经新闻数据中的情感基本面类型;
计算模块1102,用于根据情感基本面类型计算该情感对象的舆情基本面系数。
在一具体实施例中,针对财经事件的分析,由于原油具有很强的顺周期性以及政治敏感性,与外汇有一定的类似性。根据概率论中的大数定律,可以证明当数据量趋近于正无穷的时候,经验分布函数趋向于真正的分布函数。财经事件分析跟据分布函数计算“财经事件”带来的经验系数。
在一实施例中,如图12所示,训练样本生成单元904包括:
输入模块1201,用于将训练样本集合中的部分舆情基本面系数和部分经验系数作为输入信号输入至MLP神经网络模型;
目标训练模块1202,用于以贵金属市场价格走势作为MLP神经网络模型的训练目标进行训练;
验证模块1203,用于将剩余舆情基本面系数和剩余经验系数作为模型验证数据验证训练后的模型。
在一具体实施例中,对情感分类、舆情基本面、财经事件分析后的舆情基本面系数和经验系数作为训练样本,并将训练样本中80%的数据作为MLP神经网络模型的输入信号,使用市场价格走势作为训练目标,剩余20%的数据用于验证该模型。
本申请所提供的装置通过自然语言处理技术从财经新闻中提取贵金属的价格信号,然后从财经新闻中提取情感对象并对情感对象进行分类,明确了所要分析的目标。通过分析新闻中的舆情,判断该情感对象的舆情风向,舆情对于情感对象的评价是偏向积极性的还是偏向消极性的,实现了对于新闻舆情的准确分析和判断,有利于后续对情感对象进行整体价值评估。接下来对发生的财经事件进行分析,由于贵金属价格具有很强的顺周期特性,因此,根据贵金属的历史价格走势可以获得经验分布函数,从而获得财经事件对于贵金属价格的影响因子,实现了科学判断影响贵金属价格的条件并量化其对贵金属价格影响程度的功能。最后,根据上述获得的情感分类、舆情基本面分析结果和财经事件影响因子作为神经网络模型的训练样本,训练获得成熟的贵金属价格趋势预测模型,利用该贵金属价格趋势预测模型预测贵金属的未来价格走势实现了无需人工分析即可自动获取价格走势的技术效果,提升了市场判断效率和准确性,同时,由于神经网络模型相比于人而言更加理性,不会被感性因素所影响,因此得到的趋势预测结果比人工分析结果更加准确,更加贴合实际情况。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
本发明中应用了具体实施例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种电子设备的具体实施方式,参见图13,所述电子设备具体包括如下内容:
处理器(processor)1301、内存1302、通信接口(Communications Interface)1303、总线1304和非易失性存储器1305;
其中,所述处理器1301、内存1302、通信接口1303通过所述总线1304完成相互间的通信;
所述处理器1301用于调用所述内存1302和非易失性存储器1305中的计算机程序,所述处理器执行所述计算机程序时实现上述实施例中的方法中的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101:获取贵金属的当前价格数据。
S102:将当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果。
价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。
在S101的一种实现方式中,可以由交易员触发本申请实施例提供的贵金属价格趋势预测过程,具体可以为:接收客户端设备发送的由交易员上传的贵金属当前价格数据和贵金属价格相关新闻。
在S102的一种实现方式中,当获取了贵金属的当前价格数据和相关财经新闻后,将其输入至预先训练好的价格趋势预测模型中即可自动获得贵金属的价格趋势预测结果。
图1所述方法的执行主体可以为PC、计算机等,本申请提供的贵金属价格趋势预测方法,通过自然语言处理技术对财经新闻进行提取,并用提取后的结果训练神经网络模型,以价格趋势预测作为训练目的,将训练好的神经网络模型应用于实际中,只需将当前信息输入神经网络模型中即可获得价格趋势预测结果,排除了对于交易员经验的依赖并且可以不受感性因素影响理性地获得更为准确的价格预测结果。
本申请的实施例还提供能够实现上述实施例中的方法中全部步骤的一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,该计算机程序被处理器执行时实现上述实施例中的方法的全部步骤,例如,所述处理器执行所述计算机程序时实现下述步骤:
S101:获取贵金属的当前价格数据。
S102:将当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果。
价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。
在S101的一种实现方式中,可以由交易员触发本申请实施例提供的贵金属价格趋势预测过程,具体可以为:接收客户端设备发送的由交易员上传的贵金属当前价格数据和贵金属价格相关新闻。
在S102的一种实现方式中,当获取了贵金属的当前价格数据和相关财经新闻后,将其输入至预先训练好的价格趋势预测模型中即可自动获得贵金属的价格趋势预测结果。
图1所述方法的执行主体可以为PC、计算机等,本申请提供的贵金属价格趋势预测方法,通过自然语言处理技术对财经新闻进行提取,并用提取后的结果训练神经网络模型,以价格趋势预测作为训练目的,将训练好的神经网络模型应用于实际中,只需将当前信息输入神经网络模型中即可获得价格趋势预测结果,排除了对于交易员经验的依赖并且可以不受感性因素影响理性地获得更为准确的价格预测结果。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于硬件+程序类实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。虽然本说明书实施例提供了如实施例或流程图所述的方法操作步骤,但基于常规或者无创造性的手段可以包括更多或者更少的操作步骤。实施例中列举的步骤顺序仅仅为众多步骤执行顺序中的一种方式,不代表唯一的执行顺序。在实际中的装置或终端产品执行时,可以按照实施例或者附图所示的方法顺序执行或者并行执行(例如并行处理器或者多线程处理的环境,甚至为分布式数据处理环境)。术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。为了描述的方便,描述以上装置时以功能分为各种模块分别描述。当然,在实施本说明书实施例时可以把各模块的功能在同一个或多个软件和/或硬件中实现,也可以将实现同一功能的模块由多个子模块或子单元的组合实现等。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。本领域技术人员应明白,本说明书的实施例可提供为方法、系统或计算机程序产品。因此,本说明书实施例可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本说明书实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本说明书实施例的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。以上所述仅为本说明书实施例的实施例而已,并不用于限制本说明书实施例。对于本领域技术人员来说,本说明书实施例可以有各种更改和变化。凡在本说明书实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书实施例的权利要求范围之内。

Claims (10)

1.一种贵金属价格趋势预测方法,其特征在于,包括:
获取贵金属的当前价格数据;
将所述当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果;所述价格趋势预测模型为MLP神经网络模型;所述价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。
2.根据权利要求1所述的贵金属价格趋势预测方法,其特征在于,所述价格趋势预测模型的训练方法包括:
将获取的财经新闻数据转化为词向量、句向量和文本向量;
根据所述词向量、所述句向量和所述文本向量获得舆情基本面系数;
根据贵金属的历史价格数据建立经验分布函数获得经验系数;
根据所述舆情基本面系数及所述经验系数生成训练样本集合;
利用所述训练样本集合对MLP神经网络模型进行训练,以预测价格趋势为训练目标,获得所述价格趋势预测模型。
3.根据权利要求2所述的贵金属价格趋势预测方法,其特征在于,所述将获取的财经新闻数据转化为词向量、句向量和文本向量,包括:
通过词向量相关模型对财经新闻数据进行分词并获得所述词向量;
通过无监督算法将财经新闻数据分解转化为所述句向量;
对所述词向量和所述句向量进行累加归一计算,获得所述文本向量。
4.根据权利要求2或3任一项所述的贵金属价格趋势预测方法,其特征在于,所述根据所述词向量、所述句向量和所述文本向量获得舆情基本面系数,包括:
从所述词向量、所述句向量和所述文本向量中确定情感对象,并通过段落语法分析获得财经新闻数据中的情感基本面类型;
根据所述情感基本面类型计算该情感对象的舆情基本面系数。
5.根据权利要求4所述的贵金属价格趋势预测方法,其特征在于,所述根据所述情感基本面类型计算该情感对象的舆情基本面系数,包括:
识别所述情感基本面类型中描述基本情感和市场情感的关键词;
根据描述基本情感的关键词计算基础得分;
根据描述市场情感的关键词计算修饰符得分;
将所述基础得分和所述修饰符得分相加获得舆情基本面系数。
6.根据权利要求5所述的贵金属价格趋势预测方法,其特征在于,所述利用所述训练样本集合对MLP神经网络模型进行训练,包括:
将训练样本集合中的部分所述舆情基本面系数和部分所述经验系数作为输入信号输入至MLP神经网络模型;
以贵金属市场价格走势作为MLP神经网络模型的训练目标进行训练;
将剩余所述舆情基本面系数和剩余所述经验系数作为模型验证数据验证训练后的模型。
7.根据权利要求6所述的贵金属价格趋势预测方法,其特征在于,所述将剩余所述舆情基本面系数和剩余所述经验系数作为模型验证数据验证训练后的模型,包括:
将剩余所述舆情基本面系数和剩余所述经验系数输入训练后的模型中获得输出结果;
验证输出结果和实际结果是否一致,并根据验证结果确定是否对模型进行继续训练。
8.一种贵金属价格趋势预测装置,其特征在于,包括:
当前价格数据获取单元,用于获取贵金属的当前价格数据;
价格趋势预测单元,用于将所述当前价格数据输入预先训练的价格趋势预测模型中获得贵金属的价格趋势预测结果;所述价格趋势预测模型为MLP神经网络模型;所述价格趋势预测模型为利用对从相关新闻中获取的自然语言数据进行矢量转换并提取的基本面分析因子作为训练要素而获得。
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项所述的贵金属价格趋势预测方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至7任一项所述的贵金属价格趋势预测方法的步骤。
CN202110416814.3A 2021-04-19 2021-04-19 一种贵金属价格趋势预测方法及装置 Pending CN113112299A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110416814.3A CN113112299A (zh) 2021-04-19 2021-04-19 一种贵金属价格趋势预测方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110416814.3A CN113112299A (zh) 2021-04-19 2021-04-19 一种贵金属价格趋势预测方法及装置

Publications (1)

Publication Number Publication Date
CN113112299A true CN113112299A (zh) 2021-07-13

Family

ID=76718333

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110416814.3A Pending CN113112299A (zh) 2021-04-19 2021-04-19 一种贵金属价格趋势预测方法及装置

Country Status (1)

Country Link
CN (1) CN113112299A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113643060A (zh) * 2021-08-12 2021-11-12 工银科技有限公司 产品价格的预测方法和装置

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113643060A (zh) * 2021-08-12 2021-11-12 工银科技有限公司 产品价格的预测方法和装置

Similar Documents

Publication Publication Date Title
US20230222366A1 (en) Systems and methods for semantic analysis based on knowledge graph
CN111161740A (zh) 意图识别模型训练方法、意图识别方法以及相关装置
CN109086265B (zh) 一种语义训练方法、短文本中多语义词消歧方法
CN112800053B (zh) 数据模型的生成方法、调用方法、装置、设备及存储介质
CN110909165A (zh) 数据处理方法、装置、介质及电子设备
CN111210335A (zh) 用户风险识别方法、装置及电子设备
CN111210336A (zh) 用户风险模型生成方法、装置及电子设备
Fu et al. A sentiment-aware trading volume prediction model for P2P market using LSTM
CN110389932B (zh) 电力文件自动分类方法及装置
CN113392920B (zh) 生成作弊预测模型的方法、装置、设备、介质及程序产品
CN111210332A (zh) 贷后管理策略生成方法、装置及电子设备
CN113378090B (zh) 一种互联网网站相似度分析方法、装置以及可读存储介质
CN113112299A (zh) 一种贵金属价格趋势预测方法及装置
CN116596662A (zh) 基于企业舆情信息的风险预警的方法、装置、电子设备和介质
CN115048487A (zh) 基于人工智能的舆情分析方法、装置、计算机设备及介质
CN115393034A (zh) 基于自然语言处理技术对企业账户进行风险识别的方法
CN115034762A (zh) 一种岗位推荐方法、装置、存储介质、电子设备及产品
CN113627514A (zh) 知识图谱的数据处理方法、装置、电子设备和存储介质
CN113051911A (zh) 提取敏感词的方法、装置、设备、介质及程序产品
CN117172632B (zh) 一种企业异常行为检测方法、装置、设备及存储介质
CN114912934A (zh) 用户意愿识别方法、装置以及电子设备
CN108628861B (zh) 用于推送信息的方法和装置
CN113706174A (zh) 基于机器学习算法的违约预测方法、装置、设备及介质
CN116204640A (zh) 投诉类型的预测方法、装置、计算机设备和存储介质
CN117688181A (zh) 文本数据的聚类方法、装置、存储介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination