CN112580364A - 金融市场资讯信息处理方法及装置 - Google Patents
金融市场资讯信息处理方法及装置 Download PDFInfo
- Publication number
- CN112580364A CN112580364A CN202011563716.4A CN202011563716A CN112580364A CN 112580364 A CN112580364 A CN 112580364A CN 202011563716 A CN202011563716 A CN 202011563716A CN 112580364 A CN112580364 A CN 112580364A
- Authority
- CN
- China
- Prior art keywords
- information
- key information
- financial market
- information processing
- market information
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 230000010365 information processing Effects 0.000 title claims abstract description 88
- 238000003672 processing method Methods 0.000 title claims abstract description 34
- 238000012545 processing Methods 0.000 claims abstract description 26
- 238000013145 classification model Methods 0.000 claims abstract description 22
- 238000012549 training Methods 0.000 claims description 31
- 238000000034 method Methods 0.000 claims description 26
- 230000015654 memory Effects 0.000 claims description 19
- 238000007635 classification algorithm Methods 0.000 claims description 16
- 238000004458 analytical method Methods 0.000 claims description 12
- 238000004590 computer program Methods 0.000 claims description 12
- 238000004422 calculation algorithm Methods 0.000 claims description 11
- 239000013598 vector Substances 0.000 claims description 9
- 238000010586 diagram Methods 0.000 description 9
- 238000005516 engineering process Methods 0.000 description 5
- 230000008569 process Effects 0.000 description 5
- 230000014509 gene expression Effects 0.000 description 4
- 238000003058 natural language processing Methods 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 238000011160 research Methods 0.000 description 3
- 230000008719 thickening Effects 0.000 description 3
- 238000004891 communication Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000002372 labelling Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 239000007787 solid Substances 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 239000003086 colorant Substances 0.000 description 1
- 238000000354 decomposition reaction Methods 0.000 description 1
- 230000007717 exclusion Effects 0.000 description 1
- 238000005562 fading Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000004904 shortening Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/30—Semantic analysis
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F40/00—Handling natural language data
- G06F40/20—Natural language analysis
- G06F40/279—Recognition of textual entities
- G06F40/289—Phrasal analysis, e.g. finite state techniques or chunking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N20/00—Machine learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
- G06N3/088—Non-supervised learning, e.g. competitive learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06Q—INFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
- G06Q40/00—Finance; Insurance; Tax strategies; Processing of corporate or income taxes
- G06Q40/06—Asset management; Financial planning or analysis
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- Evolutionary Computation (AREA)
- Business, Economics & Management (AREA)
- General Health & Medical Sciences (AREA)
- Computational Linguistics (AREA)
- Accounting & Taxation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Audiology, Speech & Language Pathology (AREA)
- Finance (AREA)
- Development Economics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Computing Systems (AREA)
- Mathematical Physics (AREA)
- Game Theory and Decision Science (AREA)
- Marketing (AREA)
- Medical Informatics (AREA)
- Entrepreneurship & Innovation (AREA)
- Bioinformatics & Computational Biology (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Human Resources & Organizations (AREA)
- Operations Research (AREA)
- Economics (AREA)
- Evolutionary Biology (AREA)
- Strategic Management (AREA)
- Technology Law (AREA)
- General Business, Economics & Management (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Molecular Biology (AREA)
- Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)
Abstract
本发明公开了一种金融市场资讯信息处理方法及装置,用于金融领域或其他技术领域,该金融市场资讯信息处理方法包括:获取金融市场资讯信息中的关键信息;将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。本发明能够有效的帮助客户或从业人员高效、准确地把握金融市场资讯中的关键信息,提高了用户阅读金融市场资讯的体验。
Description
技术领域
本发明涉及自然语言处理技术领域,具体而言,涉及一种金融市场资讯信息处理方法及装置。
背景技术
随着信息时代的到来,各行各业的资讯信息呈爆炸式增长。尤其是在互联网技术的帮助下,各类信息对于人来说越来越触手可及,但普通人有限的精力和无限膨胀的资讯信息的矛盾越发突出。在金融市场领域,信息就是一切。寻找机会、获取收益、规避风险,无一不依赖于有效、全面而精确的资讯信息。虽然各类资讯服务商会为客户提供金融市场资讯整合和推送服务,但目前金融市场资讯通常由冗长、专业且晦涩的专业语言写成,阅读需要耗费大量的精力,客户难以准确、快速的把握金融市场资讯中的关键信息。因此,如何帮助用户高效、准确地把握金融市场资讯中的关键信息是本领域急需解决的技术问题。
发明内容
本发明为了解决上述背景技术中的技术问题,提出了一种金融市场资讯信息处理方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种金融市场资讯信息处理方法,该方法包括:
获取金融市场资讯信息中的关键信息;
将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
可选的,所述类型包括:角色;所述金融市场资讯信息处理方法,还包括:
获取每个角色类关键信息各自对应的置信度;
将所述置信度添加到所述金融市场资讯信息中。
可选的,该金融市场资讯信息处理方法,还包括:
根据预设的关键信息数据集采用无监督学习分类算法训练出所述分类模型。
可选的,该金融市场资讯信息处理方法,还包括:
根据预设的训练数据采用有监督学习分类算法训练出初始模型,其中,所述训练数据为标注出类型的关键信息;
在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练,得到所述分类模型。
可选的,该金融市场资讯信息处理方法,还包括:
根据预设的历史置信度分析数据进行分析处理,得到各角色类关键信息各自对应的置信度,其中,所述历史置信度分析数据包含:角色类关键信息、资产类关键信息、观点类关键信息以及观点类关键信息的历史真实结果。
可选的,该金融市场资讯信息处理方法,还包括:
通过自然语言识别算法将所述金融市场资讯信息分解成词向量;
针对所述词向量使用语义识别算法识别出所述关键信息。
为了实现上述目的,根据本发明的另一方面,提供了一种金融市场资讯信息处理装置,该装置包括:
关键信息获取单元,用于获取金融市场资讯信息中的关键信息;
分类处理单元,用于将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
信息处理方式确定单元,用于根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
金融市场资讯信息处理单元,用于根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
可选的,所述类型包括:角色;所述金融市场资讯信息处理装置,还包括:
置信度获取单元,用于获取每个角色类关键信息各自对应的置信度;
置信度添加单元,用于将所述置信度添加到所述金融市场资讯信息中。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述金融市场资讯信息处理方法中的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述金融市场资讯信息处理方法中的步骤。
本发明的有益效果为:本发明实施例通过将金融市场资讯信息中的关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型,进而根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式,最后根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理,实现了有效的帮助客户高效、准确地把握金融市场资讯中的关键信息的技术效果,提高了用户阅读金融市场资讯的用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例金融市场资讯信息处理方法的第一流程图;
图2是本发明实施例金融市场资讯信息处理方法的第二流程图;
图3是本发明实施例训练分类模型的流程图;
图4是本发明实施例金融市场资讯信息示意图;
图5是本发明实施例对关键信息进行处理后的金融市场资讯信息示意图;
图6是本发明实施例标注置信度后的金融市场资讯信息示意图;
图7是本发明实施例金融市场资讯信息处理装置的第一结构框图;
图8是本发明实施例金融市场资讯信息处理装置的第二结构框图;
图9是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
需要说明的是,本发明的金融市场资讯信息处理方法及装置可用于金融领域,也可以用于其他技术领域。
图1是本发明实施例金融市场资讯信息处理方法的第一流程图,如图1所示,本实施例的金融市场资讯信息处理方法包括步骤S101至步骤S104。
步骤S101,获取金融市场资讯信息中的关键信息。
在本发明一个可选实施例中,金融市场资讯信息可以为新闻、研报等金融市场资讯。
在本发明另一个可选实施例中,金融市场资讯信息可以为对金融市场资讯进行语义识别提取出的特定资讯信息,该特定资讯信息可以包括:资讯渠道、金融领域的关键词、金融领域的关键市场参与者以及金融领域的常用表达方式等,具体的可以见图4的实施例。
在本发明一个实施例中,金融市场资讯信息中的关键信息可以为通过语义识别算法从金融市场资讯信息中提取出的金融领域重点关注的关键词。所述关键信息包括:资产、角色以及观点等多个类型。例如资产类的关键信息可以包括:外汇、商品以及债券等;角色类的关键信息可以包括:政府、央行以及第三方等;观点类的关键信息可以包括:看涨、看跌以及震荡等。
步骤S102,将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型。
在本发明一个实施例中,分类模型可以为根据预设的关键信息数据集采用无监督学习分类算法训练出的,其中,关键信息数据集包含大量的历史金融市场资讯信息中的关键信息。
在本发明另一个实施例中,分类模型还可以为先根据预设的训练数据采用有监督学习分类算法训练出初始模型,再在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练得到的,其中,所述训练数据为标注出类型的关键信息,关键信息数据集包含大量的历史金融市场资讯信息中的关键信息。
在本发明一个实施例中,关键信息的类型可以包括:资产、角色以及观点等多个分类。
步骤S103,根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式。
在本发明实施例中,本发明先设置好每个关键信息分类各自对应的信息处理方式。
在本发明一个实施例中,信息处理方式可以包括:划重点、颜色标注以及字体加粗。具体实施时,资产类的关键信息对应的信息处理方式可以为字体加粗;角色类的关键信息对应的信息处理方式可以为字体加粗;观点类的关键信息对应的信息处理方式可以为划重点和颜色标注。
在本发明一个实施例中,观点类的关键信息包括正面观点类关键信息和负面观点类关键信息,正面观点类关键信息对应的信息处理方式包括标注为红色,负面观点类关键信息对应的信息处理方式包括标注为绿色。
在本发明一个实施例中,除资产、角色以及观点类以外的其他分类的关键信息对应的信息处理方式可以为信息淡化处理。
步骤S104,根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
在本发明实施例中,本步骤根据每个关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理,得到处理结果,具体的处理结果可以如图5所示。
本发明根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理,实现了有效的帮助客户高效、准确地把握金融市场资讯中的关键信息的技术效果,提高了客户阅读金融市场资讯的用户体验。
在本发明一个实施例中,关键信息的分类包括:角色。图2是本发明实施例金融市场资讯信息处理方法的第二流程图,如图2所示,本发明的金融市场资讯信息处理方法还包括步骤S201和步骤S202。
步骤S201,获取每个角色类关键信息各自对应的置信度。
在本发明实施例中,本发明预先确定出每个角色类关键信息各自对应的置信度。具体的确定置信度的方法可以为:首先获取每个角色类关键信息对应的多个观点数据以及各观点数据各自对应的历史真实结果;然后根据观点数据以及观点数据各自对应的历史真实结果进行分析处理,得到每个角色类关键信息各自对应的置信度。
步骤S202,将所述置信度添加到所述金融市场资讯信息中。
在本发明一个实施例中,本步骤具体将置信度标注到金融市场资讯信息中的该置信度对应的角色类关键信息附近处。可选的,本发明在标注置信度时还根据置信度的数值大小将置信度标注为多种颜色。
图6是本发明实施例标注置信度后的金融市场资讯信息示意图,如图6所示,本发明将角色类关键信息对应的置信度标注在该角色类关键信息附近处,便于阅读。
在本发明一个实施例中,上述步骤S102中的分类模型具体可以为根据预设的关键信息数据集采用无监督学习分类算法训练出的。关键信息数据集包含大量的历史金融市场资讯信息中的关键信息。本实施例采用无监督学习分类算法有助于提高分类的准确性。
图3是本发明实施例训练分类模型的流程图,如图3所示,在本发明另一个实施例中,上述步骤S102中的分类模型具体由步骤S301和步骤S302训练得出。
步骤S301,根据预设的训练数据采用有监督学习分类算法训练出初始模型,其中,所述训练数据为标注出类型的关键信息。
步骤S302,在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练,得到所述分类模型。
在本发明一个实施例中,上述步骤S201中的每个角色类关键信息各自对应的置信度是由以下步骤确定出的:
根据预设的历史置信度分析数据进行分析处理,得到各角色类关键信息各自对应的置信度,其中,所述历史置信度分析数据包含:角色类关键信息、资产类关键信息、观点类关键信息以及观点类关键信息的历史真实结果。
在本发明一个实施例中,本发明具体可以采用机器学习回归算法,对关键信息进行分类回归,生成每个角色类关键信息各自对应的置信度。定量标注必须通过有监督学习来生成,例如提取的一个信息是:资产类关键信息为FX-EUR/USD,角色类关键信息为CFETS,观点类关键信息为看涨,这些作为一组x因子;同时需要使用标签算法生成EUR/USD的y标签,例如最简单的是使用Price(T+N)/Price(T)-1。这样通过大量样本数据统计分析“角色”对于“资产”的“观点”的置信度,最终得到各角色类关键信息各自对应的置信度。
在本发明一个实施例中,上述步骤S101中的金融市场资讯信息中的关键信息具体通过以下步骤得到:
通过自然语言识别算法将所述金融市场资讯信息分解成词向量;针对所述词向量使用语义识别算法识别出所述关键信息,即排除无用信息。
在本发明一个实施例中,本发明的金融市场资讯信息具体可以通过以下步骤1至步骤5得到。
步骤1:用户选择基本的舆情分析模型。模型对应所关注的金融市场领域,如:外汇、商品、债券等。
步骤2:模型通过大量历史新闻研报信息训练,训练过程使用自然语言处理和无监督学习(归类)技术。通过学习,模型将具备以下能力:
识别该领域资讯获取的渠道,例如某网站;
识别该领域的关键词,例如外汇领域的“汇率”;
识别该领域的关键市场参与者,例如“外汇交易中心”;
识别该领域的关键表达方式,例如“预期XX大幅上涨”。
步骤3:用户可以对模型的关键参数进行调整和个性化配置:
在渠道方面,用户可以增删模型对应的资讯获取渠道;
在关键词方面,用户可以指定自己关心的关键词,或移除自己不关心的;
在参与者方面,用户也可以增删参与者,模型通过模糊匹配;
在表达方式方面,用户可以按照专家规则方式添加表达式。
步骤4:模型定期根据新增的数据进行重新训练并重新生成模型关键参数。训练方式采用滑动时间窗,在训练性能所允许的范围内时间窗可以呈缓慢扩张,增加模型对未来的预判能力。重新训练的模型参数将与用户指定参数进行运算:
模型参数a=模型参数∪用户指定参数;
模型参数b=模型参数⊕用户排除参数;
最终模型参数=模型参数a∪模型参数b。
步骤5:系统将使用模型获取所有相关的资讯信息,即得到金融市场资讯信息,具体可见图4的实施例。
为了帮助客户或者金融市场从业人员高效、准确、全面地把握金融市场资讯中所蕴含的关键信息。本发明利用自然语言处理技术高效的对包括新闻、研报等资讯信息进行高效的处理,识别其中的关键舆情信息,并利用机器学习分类、回归等技术对舆情信息分析判断,进行重点信息标注、无关信息淡化/缩短、特殊信息变色、关键观点给予置信度。经过以上处理后,客户或金融市场从业人员既可以从若干渠道的若干新闻研报中获取关键的聚合资讯,也可以通过某一信息溯源,高效查阅单一新闻研报等资讯信息,提高决策能力。
从以上实施例可以看出,本发明的金融市场资讯信息处理方法至少具有以下优点:
1、高效,自然语言处理技术可快速从专业晦涩的金融市场资讯中提取关键信息;
2、准确,机器学习技术可根据历史数据提供置信度分析等,避免人工判断的以偏概全等偏差;
3、全面,基于技术方式实现可以遍历主流资讯提供商和渠道,对于信息掌握全面。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种金融市场资讯信息处理装置,可以用于实现上述实施例所描述的金融市场资讯信息处理方法,如下面的实施例所述。由于金融市场资讯信息处理装置解决问题的原理与金融市场资讯信息处理方法相似,因此金融市场资讯信息处理装置的实施例可以参见金融市场资讯信息处理方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图7是本发明实施例金融市场资讯信息处理装置的第一结构框图,如图7所示,本发明实施例金融市场资讯信息处理装置包括:
关键信息获取单元1,用于获取金融市场资讯信息中的关键信息;
分类处理单元2,用于将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
信息处理方式确定单元3,用于根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
金融市场资讯信息处理单元4,用于根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
在本发明一个实施例中,所述类型包括:角色。图8是本发明实施例金融市场资讯信息处理装置的第二结构框图,如图8所示,本发明实施例金融市场资讯信息处理装置还包括:
置信度获取单元5,用于获取每个角色类关键信息各自对应的置信度;
置信度添加单元6,用于将所述置信度添加到所述金融市场资讯信息中。
在本发明一个实施例中,本发明实施例金融市场资讯信息处理装置还包括:
无监督分类训练单元,用于根据预设的关键信息数据集采用无监督学习分类算法训练出所述分类模型。
在本发明一个实施例中,本发明实施例金融市场资讯信息处理装置还包括:
初始模型训练单元,用于根据预设的训练数据采用有监督学习分类算法训练出初始模型,其中,所述训练数据为标注出类型的关键信息;
分类模型训练单元,用于在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练,得到所述分类模型。
在本发明一个实施例中,本发明实施例金融市场资讯信息处理装置还包括:
分析处理单元,用于根据预设的历史置信度分析数据进行分析处理,得到各角色类关键信息各自对应的置信度,其中,所述历史置信度分析数据包含:角色类关键信息、资产类关键信息、观点类关键信息以及观点类关键信息的历史真实结果。
在本发明一个实施例中,本发明实施例金融市场资讯信息处理装置还包括:
词向量分解单元,用于通过自然语言识别算法将所述金融市场资讯信息分解成词向量;
关键信息识别单元,用于针对所述词向量使用语义识别算法识别出所述关键信息。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图9所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述金融市场资讯信息处理方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种金融市场资讯信息处理方法,其特征在于,包括:
获取金融市场资讯信息中的关键信息;
将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
2.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,所述类型包括:角色;
所述金融市场资讯信息处理方法,还包括:
获取每个角色类关键信息各自对应的置信度;
将所述置信度添加到所述金融市场资讯信息中。
3.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,还包括:
根据预设的关键信息数据集采用无监督学习分类算法训练出所述分类模型。
4.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,还包括:
根据预设的训练数据采用有监督学习分类算法训练出初始模型,其中,所述训练数据为标注出类型的关键信息;
在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练,得到所述分类模型。
5.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,还包括:
根据预设的历史置信度分析数据进行分析处理,得到各角色类关键信息各自对应的置信度,其中,所述历史置信度分析数据包含:角色类关键信息、资产类关键信息、观点类关键信息以及观点类关键信息的历史真实结果。
6.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,还包括:
通过自然语言识别算法将所述金融市场资讯信息分解成词向量;
针对所述词向量使用语义识别算法识别出所述关键信息。
7.一种金融市场资讯信息处理装置,其特征在于,包括:
关键信息获取单元,用于获取金融市场资讯信息中的关键信息;
分类处理单元,用于将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
信息处理方式确定单元,用于根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
金融市场资讯信息处理单元,用于根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
8.根据权利要求7所述的金融市场资讯信息处理装置,其特征在于,所述类型包括:角色;
所述金融市场资讯信息处理装置,还包括:
置信度获取单元,用于获取每个角色类关键信息各自对应的置信度;
置信度添加单元,用于将所述置信度添加到所述金融市场资讯信息中。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序在计算机处理器中执行时实现如权利要求1至6任意一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011563716.4A CN112580364A (zh) | 2020-12-25 | 2020-12-25 | 金融市场资讯信息处理方法及装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011563716.4A CN112580364A (zh) | 2020-12-25 | 2020-12-25 | 金融市场资讯信息处理方法及装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112580364A true CN112580364A (zh) | 2021-03-30 |
Family
ID=75140558
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011563716.4A Pending CN112580364A (zh) | 2020-12-25 | 2020-12-25 | 金融市场资讯信息处理方法及装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN112580364A (zh) |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368489A (zh) * | 2016-05-12 | 2017-11-21 | 阿里巴巴集团控股有限公司 | 一种资讯数据处理方法及装置 |
CN108287817A (zh) * | 2017-05-08 | 2018-07-17 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及设备 |
CN109493233A (zh) * | 2018-09-25 | 2019-03-19 | 中国平安人寿保险股份有限公司 | 基于数据分析的金融资讯展示方法、装置、介质和设备 |
CN109582925A (zh) * | 2018-11-08 | 2019-04-05 | 厦门快商通信息技术有限公司 | 一种人机结合的语料标注方法及系统 |
CN109726327A (zh) * | 2018-12-14 | 2019-05-07 | 深圳壹账通智能科技有限公司 | 一种信息推送方法和装置 |
CN110502630A (zh) * | 2019-07-31 | 2019-11-26 | 北京字节跳动网络技术有限公司 | 信息处理方法及设备 |
CN110716991A (zh) * | 2019-10-11 | 2020-01-21 | 掌阅科技股份有限公司 | 基于电子书的实体关联信息的展示方法及电子设备 |
CN111159566A (zh) * | 2019-12-31 | 2020-05-15 | 中国银行股份有限公司 | 金融市场产品的资讯推送方法及装置 |
CN111640025A (zh) * | 2020-06-09 | 2020-09-08 | 国泰君安证券股份有限公司 | 基于标签体系实现资讯标签化处理的方法 |
KR102158352B1 (ko) * | 2020-03-27 | 2020-09-21 | (주)케이엔랩 | 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램 |
CN111737969A (zh) * | 2020-07-27 | 2020-10-02 | 北森云计算有限公司 | 一种基于深度学习的简历解析方法和系统 |
-
2020
- 2020-12-25 CN CN202011563716.4A patent/CN112580364A/zh active Pending
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107368489A (zh) * | 2016-05-12 | 2017-11-21 | 阿里巴巴集团控股有限公司 | 一种资讯数据处理方法及装置 |
CN108287817A (zh) * | 2017-05-08 | 2018-07-17 | 腾讯科技(深圳)有限公司 | 一种信息处理方法及设备 |
CN109493233A (zh) * | 2018-09-25 | 2019-03-19 | 中国平安人寿保险股份有限公司 | 基于数据分析的金融资讯展示方法、装置、介质和设备 |
CN109582925A (zh) * | 2018-11-08 | 2019-04-05 | 厦门快商通信息技术有限公司 | 一种人机结合的语料标注方法及系统 |
CN109726327A (zh) * | 2018-12-14 | 2019-05-07 | 深圳壹账通智能科技有限公司 | 一种信息推送方法和装置 |
CN110502630A (zh) * | 2019-07-31 | 2019-11-26 | 北京字节跳动网络技术有限公司 | 信息处理方法及设备 |
CN110716991A (zh) * | 2019-10-11 | 2020-01-21 | 掌阅科技股份有限公司 | 基于电子书的实体关联信息的展示方法及电子设备 |
CN111159566A (zh) * | 2019-12-31 | 2020-05-15 | 中国银行股份有限公司 | 金融市场产品的资讯推送方法及装置 |
KR102158352B1 (ko) * | 2020-03-27 | 2020-09-21 | (주)케이엔랩 | 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램 |
CN111640025A (zh) * | 2020-06-09 | 2020-09-08 | 国泰君安证券股份有限公司 | 基于标签体系实现资讯标签化处理的方法 |
CN111737969A (zh) * | 2020-07-27 | 2020-10-02 | 北森云计算有限公司 | 一种基于深度学习的简历解析方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN111859960B (zh) | 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质 | |
CN109741332B (zh) | 一种人机协同的图像分割与标注方法 | |
CN108021651B (zh) | 一种网络舆情风险评估方法及装置 | |
CN112711705B (zh) | 舆情数据处理方法、设备及存储介质 | |
CN111931809A (zh) | 数据的处理方法、装置、存储介质及电子设备 | |
CN111462752A (zh) | 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法 | |
Kwon et al. | Data-oob: Out-of-bag estimate as a simple and efficient data value | |
CN111444677A (zh) | 基于大数据的阅读模型优化方法、装置、设备及介质 | |
CN110990711B (zh) | 基于机器学习的微信公众号推荐方法及系统 | |
CN109711551A (zh) | 数据处理方法及装置 | |
CN110796482A (zh) | 用于机器学习模型的金融数据分类方法、装置及电子设备 | |
CN116049379A (zh) | 知识推荐方法、装置、电子设备和存储介质 | |
KR20220105792A (ko) | 동적 텍스트 소스를 활용한 ai 기반 의사결정지원 시스템 | |
CN115982646B (zh) | 一种基于云平台的多源测试数据的管理方法及系统 | |
Nasfi et al. | A novel feature selection method using generalized inverted Dirichlet-based HMMs for image categorization | |
CN113869049B (zh) | 基于法律咨询问题的具有法律属性的事实抽取方法及装置 | |
CN112580364A (zh) | 金融市场资讯信息处理方法及装置 | |
CN113434630B (zh) | 客服服务评估方法、装置、终端设备及介质 | |
CN114842301A (zh) | 一种图像注释模型的半监督训练方法 | |
CN114154564A (zh) | 基于异质图的关联度确定方法、装置、电子设备及存储介质 | |
CN115080732A (zh) | 投诉工单处理方法、装置、电子设备和存储介质 | |
CN113515642A (zh) | 电话营销关键断点确定方法及装置 | |
CN113591731A (zh) | 一种基于知识蒸馏的弱监督视频时序行为定位方法 | |
CN112948592A (zh) | 基于人工智能的订单分级方法、装置、设备及存储介质 | |
CN115757774B (zh) | 行业领域识别方法、装置、电子设备及存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |