CN112580364A - 金融市场资讯信息处理方法及装置 - Google Patents

金融市场资讯信息处理方法及装置 Download PDF

Info

Publication number
CN112580364A
CN112580364A CN202011563716.4A CN202011563716A CN112580364A CN 112580364 A CN112580364 A CN 112580364A CN 202011563716 A CN202011563716 A CN 202011563716A CN 112580364 A CN112580364 A CN 112580364A
Authority
CN
China
Prior art keywords
information
key information
financial market
information processing
market information
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011563716.4A
Other languages
English (en)
Inventor
廖鸿存
许璟亮
邵一飞
皇甫晓洁
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Industrial and Commercial Bank of China Ltd ICBC
Original Assignee
Industrial and Commercial Bank of China Ltd ICBC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Industrial and Commercial Bank of China Ltd ICBC filed Critical Industrial and Commercial Bank of China Ltd ICBC
Priority to CN202011563716.4A priority Critical patent/CN112580364A/zh
Publication of CN112580364A publication Critical patent/CN112580364A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/289Phrasal analysis, e.g. finite state techniques or chunking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/088Non-supervised learning, e.g. competitive learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/06Asset management; Financial planning or analysis

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Software Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Computation (AREA)
  • Business, Economics & Management (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Accounting & Taxation (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • Finance (AREA)
  • Development Economics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Game Theory and Decision Science (AREA)
  • Marketing (AREA)
  • Medical Informatics (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Human Resources & Organizations (AREA)
  • Operations Research (AREA)
  • Economics (AREA)
  • Evolutionary Biology (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Biomedical Technology (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Financial Or Insurance-Related Operations Such As Payment And Settlement (AREA)

Abstract

本发明公开了一种金融市场资讯信息处理方法及装置,用于金融领域或其他技术领域,该金融市场资讯信息处理方法包括:获取金融市场资讯信息中的关键信息;将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。本发明能够有效的帮助客户或从业人员高效、准确地把握金融市场资讯中的关键信息,提高了用户阅读金融市场资讯的体验。

Description

金融市场资讯信息处理方法及装置
技术领域
本发明涉及自然语言处理技术领域,具体而言,涉及一种金融市场资讯信息处理方法及装置。
背景技术
随着信息时代的到来,各行各业的资讯信息呈爆炸式增长。尤其是在互联网技术的帮助下,各类信息对于人来说越来越触手可及,但普通人有限的精力和无限膨胀的资讯信息的矛盾越发突出。在金融市场领域,信息就是一切。寻找机会、获取收益、规避风险,无一不依赖于有效、全面而精确的资讯信息。虽然各类资讯服务商会为客户提供金融市场资讯整合和推送服务,但目前金融市场资讯通常由冗长、专业且晦涩的专业语言写成,阅读需要耗费大量的精力,客户难以准确、快速的把握金融市场资讯中的关键信息。因此,如何帮助用户高效、准确地把握金融市场资讯中的关键信息是本领域急需解决的技术问题。
发明内容
本发明为了解决上述背景技术中的技术问题,提出了一种金融市场资讯信息处理方法及装置。
为了实现上述目的,根据本发明的一个方面,提供了一种金融市场资讯信息处理方法,该方法包括:
获取金融市场资讯信息中的关键信息;
将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
可选的,所述类型包括:角色;所述金融市场资讯信息处理方法,还包括:
获取每个角色类关键信息各自对应的置信度;
将所述置信度添加到所述金融市场资讯信息中。
可选的,该金融市场资讯信息处理方法,还包括:
根据预设的关键信息数据集采用无监督学习分类算法训练出所述分类模型。
可选的,该金融市场资讯信息处理方法,还包括:
根据预设的训练数据采用有监督学习分类算法训练出初始模型,其中,所述训练数据为标注出类型的关键信息;
在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练,得到所述分类模型。
可选的,该金融市场资讯信息处理方法,还包括:
根据预设的历史置信度分析数据进行分析处理,得到各角色类关键信息各自对应的置信度,其中,所述历史置信度分析数据包含:角色类关键信息、资产类关键信息、观点类关键信息以及观点类关键信息的历史真实结果。
可选的,该金融市场资讯信息处理方法,还包括:
通过自然语言识别算法将所述金融市场资讯信息分解成词向量;
针对所述词向量使用语义识别算法识别出所述关键信息。
为了实现上述目的,根据本发明的另一方面,提供了一种金融市场资讯信息处理装置,该装置包括:
关键信息获取单元,用于获取金融市场资讯信息中的关键信息;
分类处理单元,用于将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
信息处理方式确定单元,用于根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
金融市场资讯信息处理单元,用于根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
可选的,所述类型包括:角色;所述金融市场资讯信息处理装置,还包括:
置信度获取单元,用于获取每个角色类关键信息各自对应的置信度;
置信度添加单元,用于将所述置信度添加到所述金融市场资讯信息中。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述金融市场资讯信息处理方法中的步骤。
为了实现上述目的,根据本发明的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述金融市场资讯信息处理方法中的步骤。
本发明的有益效果为:本发明实施例通过将金融市场资讯信息中的关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型,进而根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式,最后根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理,实现了有效的帮助客户高效、准确地把握金融市场资讯中的关键信息的技术效果,提高了用户阅读金融市场资讯的用户体验。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1是本发明实施例金融市场资讯信息处理方法的第一流程图;
图2是本发明实施例金融市场资讯信息处理方法的第二流程图;
图3是本发明实施例训练分类模型的流程图;
图4是本发明实施例金融市场资讯信息示意图;
图5是本发明实施例对关键信息进行处理后的金融市场资讯信息示意图;
图6是本发明实施例标注置信度后的金融市场资讯信息示意图;
图7是本发明实施例金融市场资讯信息处理装置的第一结构框图;
图8是本发明实施例金融市场资讯信息处理装置的第二结构框图;
图9是本发明实施例计算机设备示意图。
具体实施方式
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
需要说明的是,本发明的金融市场资讯信息处理方法及装置可用于金融领域,也可以用于其他技术领域。
图1是本发明实施例金融市场资讯信息处理方法的第一流程图,如图1所示,本实施例的金融市场资讯信息处理方法包括步骤S101至步骤S104。
步骤S101,获取金融市场资讯信息中的关键信息。
在本发明一个可选实施例中,金融市场资讯信息可以为新闻、研报等金融市场资讯。
在本发明另一个可选实施例中,金融市场资讯信息可以为对金融市场资讯进行语义识别提取出的特定资讯信息,该特定资讯信息可以包括:资讯渠道、金融领域的关键词、金融领域的关键市场参与者以及金融领域的常用表达方式等,具体的可以见图4的实施例。
在本发明一个实施例中,金融市场资讯信息中的关键信息可以为通过语义识别算法从金融市场资讯信息中提取出的金融领域重点关注的关键词。所述关键信息包括:资产、角色以及观点等多个类型。例如资产类的关键信息可以包括:外汇、商品以及债券等;角色类的关键信息可以包括:政府、央行以及第三方等;观点类的关键信息可以包括:看涨、看跌以及震荡等。
步骤S102,将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型。
在本发明一个实施例中,分类模型可以为根据预设的关键信息数据集采用无监督学习分类算法训练出的,其中,关键信息数据集包含大量的历史金融市场资讯信息中的关键信息。
在本发明另一个实施例中,分类模型还可以为先根据预设的训练数据采用有监督学习分类算法训练出初始模型,再在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练得到的,其中,所述训练数据为标注出类型的关键信息,关键信息数据集包含大量的历史金融市场资讯信息中的关键信息。
在本发明一个实施例中,关键信息的类型可以包括:资产、角色以及观点等多个分类。
步骤S103,根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式。
在本发明实施例中,本发明先设置好每个关键信息分类各自对应的信息处理方式。
在本发明一个实施例中,信息处理方式可以包括:划重点、颜色标注以及字体加粗。具体实施时,资产类的关键信息对应的信息处理方式可以为字体加粗;角色类的关键信息对应的信息处理方式可以为字体加粗;观点类的关键信息对应的信息处理方式可以为划重点和颜色标注。
在本发明一个实施例中,观点类的关键信息包括正面观点类关键信息和负面观点类关键信息,正面观点类关键信息对应的信息处理方式包括标注为红色,负面观点类关键信息对应的信息处理方式包括标注为绿色。
在本发明一个实施例中,除资产、角色以及观点类以外的其他分类的关键信息对应的信息处理方式可以为信息淡化处理。
步骤S104,根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
在本发明实施例中,本步骤根据每个关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理,得到处理结果,具体的处理结果可以如图5所示。
本发明根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理,实现了有效的帮助客户高效、准确地把握金融市场资讯中的关键信息的技术效果,提高了客户阅读金融市场资讯的用户体验。
在本发明一个实施例中,关键信息的分类包括:角色。图2是本发明实施例金融市场资讯信息处理方法的第二流程图,如图2所示,本发明的金融市场资讯信息处理方法还包括步骤S201和步骤S202。
步骤S201,获取每个角色类关键信息各自对应的置信度。
在本发明实施例中,本发明预先确定出每个角色类关键信息各自对应的置信度。具体的确定置信度的方法可以为:首先获取每个角色类关键信息对应的多个观点数据以及各观点数据各自对应的历史真实结果;然后根据观点数据以及观点数据各自对应的历史真实结果进行分析处理,得到每个角色类关键信息各自对应的置信度。
步骤S202,将所述置信度添加到所述金融市场资讯信息中。
在本发明一个实施例中,本步骤具体将置信度标注到金融市场资讯信息中的该置信度对应的角色类关键信息附近处。可选的,本发明在标注置信度时还根据置信度的数值大小将置信度标注为多种颜色。
图6是本发明实施例标注置信度后的金融市场资讯信息示意图,如图6所示,本发明将角色类关键信息对应的置信度标注在该角色类关键信息附近处,便于阅读。
在本发明一个实施例中,上述步骤S102中的分类模型具体可以为根据预设的关键信息数据集采用无监督学习分类算法训练出的。关键信息数据集包含大量的历史金融市场资讯信息中的关键信息。本实施例采用无监督学习分类算法有助于提高分类的准确性。
图3是本发明实施例训练分类模型的流程图,如图3所示,在本发明另一个实施例中,上述步骤S102中的分类模型具体由步骤S301和步骤S302训练得出。
步骤S301,根据预设的训练数据采用有监督学习分类算法训练出初始模型,其中,所述训练数据为标注出类型的关键信息。
步骤S302,在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练,得到所述分类模型。
在本发明一个实施例中,上述步骤S201中的每个角色类关键信息各自对应的置信度是由以下步骤确定出的:
根据预设的历史置信度分析数据进行分析处理,得到各角色类关键信息各自对应的置信度,其中,所述历史置信度分析数据包含:角色类关键信息、资产类关键信息、观点类关键信息以及观点类关键信息的历史真实结果。
在本发明一个实施例中,本发明具体可以采用机器学习回归算法,对关键信息进行分类回归,生成每个角色类关键信息各自对应的置信度。定量标注必须通过有监督学习来生成,例如提取的一个信息是:资产类关键信息为FX-EUR/USD,角色类关键信息为CFETS,观点类关键信息为看涨,这些作为一组x因子;同时需要使用标签算法生成EUR/USD的y标签,例如最简单的是使用Price(T+N)/Price(T)-1。这样通过大量样本数据统计分析“角色”对于“资产”的“观点”的置信度,最终得到各角色类关键信息各自对应的置信度。
在本发明一个实施例中,上述步骤S101中的金融市场资讯信息中的关键信息具体通过以下步骤得到:
通过自然语言识别算法将所述金融市场资讯信息分解成词向量;针对所述词向量使用语义识别算法识别出所述关键信息,即排除无用信息。
在本发明一个实施例中,本发明的金融市场资讯信息具体可以通过以下步骤1至步骤5得到。
步骤1:用户选择基本的舆情分析模型。模型对应所关注的金融市场领域,如:外汇、商品、债券等。
步骤2:模型通过大量历史新闻研报信息训练,训练过程使用自然语言处理和无监督学习(归类)技术。通过学习,模型将具备以下能力:
识别该领域资讯获取的渠道,例如某网站;
识别该领域的关键词,例如外汇领域的“汇率”;
识别该领域的关键市场参与者,例如“外汇交易中心”;
识别该领域的关键表达方式,例如“预期XX大幅上涨”。
步骤3:用户可以对模型的关键参数进行调整和个性化配置:
在渠道方面,用户可以增删模型对应的资讯获取渠道;
在关键词方面,用户可以指定自己关心的关键词,或移除自己不关心的;
在参与者方面,用户也可以增删参与者,模型通过模糊匹配;
在表达方式方面,用户可以按照专家规则方式添加表达式。
步骤4:模型定期根据新增的数据进行重新训练并重新生成模型关键参数。训练方式采用滑动时间窗,在训练性能所允许的范围内时间窗可以呈缓慢扩张,增加模型对未来的预判能力。重新训练的模型参数将与用户指定参数进行运算:
模型参数a=模型参数∪用户指定参数;
模型参数b=模型参数⊕用户排除参数;
最终模型参数=模型参数a∪模型参数b。
步骤5:系统将使用模型获取所有相关的资讯信息,即得到金融市场资讯信息,具体可见图4的实施例。
为了帮助客户或者金融市场从业人员高效、准确、全面地把握金融市场资讯中所蕴含的关键信息。本发明利用自然语言处理技术高效的对包括新闻、研报等资讯信息进行高效的处理,识别其中的关键舆情信息,并利用机器学习分类、回归等技术对舆情信息分析判断,进行重点信息标注、无关信息淡化/缩短、特殊信息变色、关键观点给予置信度。经过以上处理后,客户或金融市场从业人员既可以从若干渠道的若干新闻研报中获取关键的聚合资讯,也可以通过某一信息溯源,高效查阅单一新闻研报等资讯信息,提高决策能力。
从以上实施例可以看出,本发明的金融市场资讯信息处理方法至少具有以下优点:
1、高效,自然语言处理技术可快速从专业晦涩的金融市场资讯中提取关键信息;
2、准确,机器学习技术可根据历史数据提供置信度分析等,避免人工判断的以偏概全等偏差;
3、全面,基于技术方式实现可以遍历主流资讯提供商和渠道,对于信息掌握全面。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
基于同一发明构思,本发明实施例还提供了一种金融市场资讯信息处理装置,可以用于实现上述实施例所描述的金融市场资讯信息处理方法,如下面的实施例所述。由于金融市场资讯信息处理装置解决问题的原理与金融市场资讯信息处理方法相似,因此金融市场资讯信息处理装置的实施例可以参见金融市场资讯信息处理方法的实施例,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
图7是本发明实施例金融市场资讯信息处理装置的第一结构框图,如图7所示,本发明实施例金融市场资讯信息处理装置包括:
关键信息获取单元1,用于获取金融市场资讯信息中的关键信息;
分类处理单元2,用于将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
信息处理方式确定单元3,用于根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
金融市场资讯信息处理单元4,用于根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
在本发明一个实施例中,所述类型包括:角色。图8是本发明实施例金融市场资讯信息处理装置的第二结构框图,如图8所示,本发明实施例金融市场资讯信息处理装置还包括:
置信度获取单元5,用于获取每个角色类关键信息各自对应的置信度;
置信度添加单元6,用于将所述置信度添加到所述金融市场资讯信息中。
在本发明一个实施例中,本发明实施例金融市场资讯信息处理装置还包括:
无监督分类训练单元,用于根据预设的关键信息数据集采用无监督学习分类算法训练出所述分类模型。
在本发明一个实施例中,本发明实施例金融市场资讯信息处理装置还包括:
初始模型训练单元,用于根据预设的训练数据采用有监督学习分类算法训练出初始模型,其中,所述训练数据为标注出类型的关键信息;
分类模型训练单元,用于在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练,得到所述分类模型。
在本发明一个实施例中,本发明实施例金融市场资讯信息处理装置还包括:
分析处理单元,用于根据预设的历史置信度分析数据进行分析处理,得到各角色类关键信息各自对应的置信度,其中,所述历史置信度分析数据包含:角色类关键信息、资产类关键信息、观点类关键信息以及观点类关键信息的历史真实结果。
在本发明一个实施例中,本发明实施例金融市场资讯信息处理装置还包括:
词向量分解单元,用于通过自然语言识别算法将所述金融市场资讯信息分解成词向量;
关键信息识别单元,用于针对所述词向量使用语义识别算法识别出所述关键信息。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机设备。如图9所示,该计算机设备包括存储器、处理器、通信接口以及通信总线,在存储器上存储有可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述实施例方法中的步骤。
处理器可以为中央处理器(Central Processing Unit,CPU)。处理器还可以为其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现场可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等芯片,或者上述各类芯片的组合。
存储器作为一种非暂态计算机可读存储介质,可用于存储非暂态软件程序、非暂态计算机可执行程序以及单元,如本发明上述方法实施例中对应的程序单元。处理器通过运行存储在存储器中的非暂态软件程序、指令以及模块,从而执行处理器的各种功能应用以及作品数据处理,即实现上述方法实施例中的方法。
存储器可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储处理器所创建的数据等。此外,存储器可以包括高速随机存取存储器,还可以包括非暂态存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态固态存储器件。在一些实施例中,存储器可选包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
所述一个或者多个单元存储在所述存储器中,当被所述处理器执行时,执行上述实施例中的方法。
上述计算机设备具体细节可以对应参阅上述实施例中对应的相关描述和效果进行理解,此处不再赘述。
为了实现上述目的,根据本申请的另一方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序在计算机处理器中执行时实现上述金融市场资讯信息处理方法中的步骤。本领域技术人员可以理解,实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的程序可存储于一计算机可读取存储介质中,该程序在执行时,可包括如上述各方法的实施例的流程。其中,所述存储介质可为磁碟、光盘、只读存储记忆体(Read-Only Memory,ROM)、随机存储记忆体(RandomAccessMemory,RAM)、快闪存储器(Flash Memory)、硬盘(Hard DiskDrive,缩写:HDD)或固态硬盘(Solid-State Drive,SSD)等;所述存储介质还可以包括上述种类的存储器的组合。
显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
以上所述仅为本发明的优选实施例而已,并不用于限制本发明,对于本领域的技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (10)

1.一种金融市场资讯信息处理方法,其特征在于,包括:
获取金融市场资讯信息中的关键信息;
将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
2.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,所述类型包括:角色;
所述金融市场资讯信息处理方法,还包括:
获取每个角色类关键信息各自对应的置信度;
将所述置信度添加到所述金融市场资讯信息中。
3.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,还包括:
根据预设的关键信息数据集采用无监督学习分类算法训练出所述分类模型。
4.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,还包括:
根据预设的训练数据采用有监督学习分类算法训练出初始模型,其中,所述训练数据为标注出类型的关键信息;
在所述初始模型的基础上根据预设的关键信息数据集采用无监督学习分类算法进行模型训练,得到所述分类模型。
5.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,还包括:
根据预设的历史置信度分析数据进行分析处理,得到各角色类关键信息各自对应的置信度,其中,所述历史置信度分析数据包含:角色类关键信息、资产类关键信息、观点类关键信息以及观点类关键信息的历史真实结果。
6.根据权利要求1所述的金融市场资讯信息处理方法,其特征在于,还包括:
通过自然语言识别算法将所述金融市场资讯信息分解成词向量;
针对所述词向量使用语义识别算法识别出所述关键信息。
7.一种金融市场资讯信息处理装置,其特征在于,包括:
关键信息获取单元,用于获取金融市场资讯信息中的关键信息;
分类处理单元,用于将所述关键信息输入到训练好的分类模型中,得到每个所述关键信息各自对应的类型;
信息处理方式确定单元,用于根据预设的类型与信息处理方式之间的对应关系确定每个所述关键信息各自对应的信息处理方式;
金融市场资讯信息处理单元,用于根据每个所述关键信息各自对应的信息处理方式对所述金融市场资讯信息中的各关键信息进行处理。
8.根据权利要求7所述的金融市场资讯信息处理装置,其特征在于,所述类型包括:角色;
所述金融市场资讯信息处理装置,还包括:
置信度获取单元,用于获取每个角色类关键信息各自对应的置信度;
置信度添加单元,用于将所述置信度添加到所述金融市场资讯信息中。
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6任一项所述的方法。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序在计算机处理器中执行时实现如权利要求1至6任意一项所述的方法。
CN202011563716.4A 2020-12-25 2020-12-25 金融市场资讯信息处理方法及装置 Pending CN112580364A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011563716.4A CN112580364A (zh) 2020-12-25 2020-12-25 金融市场资讯信息处理方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011563716.4A CN112580364A (zh) 2020-12-25 2020-12-25 金融市场资讯信息处理方法及装置

Publications (1)

Publication Number Publication Date
CN112580364A true CN112580364A (zh) 2021-03-30

Family

ID=75140558

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011563716.4A Pending CN112580364A (zh) 2020-12-25 2020-12-25 金融市场资讯信息处理方法及装置

Country Status (1)

Country Link
CN (1) CN112580364A (zh)

Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368489A (zh) * 2016-05-12 2017-11-21 阿里巴巴集团控股有限公司 一种资讯数据处理方法及装置
CN108287817A (zh) * 2017-05-08 2018-07-17 腾讯科技(深圳)有限公司 一种信息处理方法及设备
CN109493233A (zh) * 2018-09-25 2019-03-19 中国平安人寿保险股份有限公司 基于数据分析的金融资讯展示方法、装置、介质和设备
CN109582925A (zh) * 2018-11-08 2019-04-05 厦门快商通信息技术有限公司 一种人机结合的语料标注方法及系统
CN109726327A (zh) * 2018-12-14 2019-05-07 深圳壹账通智能科技有限公司 一种信息推送方法和装置
CN110502630A (zh) * 2019-07-31 2019-11-26 北京字节跳动网络技术有限公司 信息处理方法及设备
CN110716991A (zh) * 2019-10-11 2020-01-21 掌阅科技股份有限公司 基于电子书的实体关联信息的展示方法及电子设备
CN111159566A (zh) * 2019-12-31 2020-05-15 中国银行股份有限公司 金融市场产品的资讯推送方法及装置
CN111640025A (zh) * 2020-06-09 2020-09-08 国泰君安证券股份有限公司 基于标签体系实现资讯标签化处理的方法
KR102158352B1 (ko) * 2020-03-27 2020-09-21 (주)케이엔랩 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램
CN111737969A (zh) * 2020-07-27 2020-10-02 北森云计算有限公司 一种基于深度学习的简历解析方法和系统

Patent Citations (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN107368489A (zh) * 2016-05-12 2017-11-21 阿里巴巴集团控股有限公司 一种资讯数据处理方法及装置
CN108287817A (zh) * 2017-05-08 2018-07-17 腾讯科技(深圳)有限公司 一种信息处理方法及设备
CN109493233A (zh) * 2018-09-25 2019-03-19 中国平安人寿保险股份有限公司 基于数据分析的金融资讯展示方法、装置、介质和设备
CN109582925A (zh) * 2018-11-08 2019-04-05 厦门快商通信息技术有限公司 一种人机结合的语料标注方法及系统
CN109726327A (zh) * 2018-12-14 2019-05-07 深圳壹账通智能科技有限公司 一种信息推送方法和装置
CN110502630A (zh) * 2019-07-31 2019-11-26 北京字节跳动网络技术有限公司 信息处理方法及设备
CN110716991A (zh) * 2019-10-11 2020-01-21 掌阅科技股份有限公司 基于电子书的实体关联信息的展示方法及电子设备
CN111159566A (zh) * 2019-12-31 2020-05-15 中国银行股份有限公司 金融市场产品的资讯推送方法及装置
KR102158352B1 (ko) * 2020-03-27 2020-09-21 (주)케이엔랩 정책정보 문서의 요지 정보 제공 방법, 정책정보 제공 시스템, 이를 위한 컴퓨터 프로그램
CN111640025A (zh) * 2020-06-09 2020-09-08 国泰君安证券股份有限公司 基于标签体系实现资讯标签化处理的方法
CN111737969A (zh) * 2020-07-27 2020-10-02 北森云计算有限公司 一种基于深度学习的简历解析方法和系统

Similar Documents

Publication Publication Date Title
CN111859960B (zh) 基于知识蒸馏的语义匹配方法、装置、计算机设备和介质
CN109741332B (zh) 一种人机协同的图像分割与标注方法
CN108021651B (zh) 一种网络舆情风险评估方法及装置
CN112711705B (zh) 舆情数据处理方法、设备及存储介质
CN111931809A (zh) 数据的处理方法、装置、存储介质及电子设备
CN111462752A (zh) 基于注意力机制、特征嵌入及bi-lstm的客户意图识别方法
Kwon et al. Data-oob: Out-of-bag estimate as a simple and efficient data value
CN111444677A (zh) 基于大数据的阅读模型优化方法、装置、设备及介质
CN110990711B (zh) 基于机器学习的微信公众号推荐方法及系统
CN109711551A (zh) 数据处理方法及装置
CN110796482A (zh) 用于机器学习模型的金融数据分类方法、装置及电子设备
CN116049379A (zh) 知识推荐方法、装置、电子设备和存储介质
KR20220105792A (ko) 동적 텍스트 소스를 활용한 ai 기반 의사결정지원 시스템
CN115982646B (zh) 一种基于云平台的多源测试数据的管理方法及系统
Nasfi et al. A novel feature selection method using generalized inverted Dirichlet-based HMMs for image categorization
CN113869049B (zh) 基于法律咨询问题的具有法律属性的事实抽取方法及装置
CN112580364A (zh) 金融市场资讯信息处理方法及装置
CN113434630B (zh) 客服服务评估方法、装置、终端设备及介质
CN114842301A (zh) 一种图像注释模型的半监督训练方法
CN114154564A (zh) 基于异质图的关联度确定方法、装置、电子设备及存储介质
CN115080732A (zh) 投诉工单处理方法、装置、电子设备和存储介质
CN113515642A (zh) 电话营销关键断点确定方法及装置
CN113591731A (zh) 一种基于知识蒸馏的弱监督视频时序行为定位方法
CN112948592A (zh) 基于人工智能的订单分级方法、装置、设备及存储介质
CN115757774B (zh) 行业领域识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination