CN117764458A - 业绩趋势分析方法、装置、设备及存储介质 - Google Patents
业绩趋势分析方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN117764458A CN117764458A CN202410059994.8A CN202410059994A CN117764458A CN 117764458 A CN117764458 A CN 117764458A CN 202410059994 A CN202410059994 A CN 202410059994A CN 117764458 A CN117764458 A CN 117764458A
- Authority
- CN
- China
- Prior art keywords
- emotion
- index
- analyzed
- performance
- keyword
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000004458 analytical method Methods 0.000 title claims abstract description 72
- 230000008451 emotion Effects 0.000 claims abstract description 307
- 238000012937 correction Methods 0.000 claims description 14
- 239000013598 vector Substances 0.000 claims description 11
- 238000000605 extraction Methods 0.000 claims description 7
- 238000003062 neural network model Methods 0.000 claims description 5
- 230000001105 regulatory effect Effects 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 19
- 238000012545 processing Methods 0.000 abstract description 5
- 238000013528 artificial neural network Methods 0.000 description 7
- 238000004891 communication Methods 0.000 description 7
- 230000008569 process Effects 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 5
- 238000010586 diagram Methods 0.000 description 5
- 230000007935 neutral effect Effects 0.000 description 5
- 238000011161 development Methods 0.000 description 4
- 230000018109 developmental process Effects 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 4
- 230000002996 emotional effect Effects 0.000 description 3
- 238000011156 evaluation Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 230000002452 interceptive effect Effects 0.000 description 2
- 238000012544 monitoring process Methods 0.000 description 2
- 230000036651 mood Effects 0.000 description 2
- 206010063659 Aversion Diseases 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002457 bidirectional effect Effects 0.000 description 1
- 230000008859 change Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 208000037265 diseases, disorders, signs and symptoms Diseases 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000003058 natural language processing Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000033764 rhythmic process Effects 0.000 description 1
- 230000000630 rising effect Effects 0.000 description 1
- 230000011218 segmentation Effects 0.000 description 1
- XLYOFNOQVPJJNP-UHFFFAOYSA-N water Substances O XLYOFNOQVPJJNP-UHFFFAOYSA-N 0.000 description 1
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明属于数据处理技术领域,公开了一种业绩趋势分析方法、装置、设备及存储介质;该方法包括:获取目标企业的各个待分析指标;基于待分析指标搜索目标企业相关的参考文本,根据参考文本得到情绪关键词信息;根据情绪关键词信息构建待分析指标的情感词语集,根据情感词语集确定各个待分析指标的情感趋势;基于情感趋势对目标企业的业绩趋势进行分析;本发明通过采集与企业业绩相关的各个指标的文本内容得到关键词,识别各个关键词的情绪值,进一步计算各个指标的情绪值,得到各个指标对企业业绩的影响程度以及民众和/或市场对于企业业绩的情绪值,基于情绪值的大小和正负来判断企业业绩趋势,实现对企业业绩趋势更准确的分析。
Description
技术领域
本发明涉及数据处理技术领域,尤其涉及一种业绩趋势分析方法、装置、设备及存储介质。
背景技术
互联网数据分析可以帮助企业和组织了解用户行为、市场趋势、产品性能等信息,从而做出更明智的决策。通过监测和分析社交媒体平台上的用户评论、话题讨论、品牌声誉等信息,可以获取用户对品牌和产品的看法和意见。这些数据可以帮助企业了解用户的需求、喜好和行为,从而进行更有针对性的市场营销。
随着互联网技术的进步和因特网的快速普及,网络用户数量急剧增长,社交媒体、购物网站等各种能够提供用户交流的网络服务形式,带来了用户生成内容的急剧增加,这些内容包含用户对消费产品、影视娱乐、新闻时事等发表的个人观点,抒发了用户的个人情绪。通过识别用户评论中包含的积极、消极、厌恶、反对等多样的情绪,能够更好的理解用户针对具体话题、产品、政策及大众人物的个人情绪,有利于个人、商家和企业,提高服务质量并对企业发展趋势的分析。
企业相关的舆情的产生、扩大和传播对投资者、金融机构、金融业乃至宏观经济运行都会对企业的业绩产生重要影响,往往一些小的信用危机,则有可能酿成金融危机事件。因此,基于对互联网数据进行有效的监测与分析可以把握预期管理的节奏,减少和避免企业危机的发生,辅助股民或者企业把握某些企业的资产变动等方面有着重要参考价值。
发明内容
本发明的主要目的在于提供一种业绩趋势分析方法、装置、设备及存储介质,旨在解决现有技术更多通过企业发布的绩效、报表进行业绩评估不具备公信力,忽略大众情绪对于企业发展的影响,导致对企业业绩趋势分析不够准确的技术问题。
为实现上述目的,本发明提供了一种业绩趋势分析方法,所述方法包括以下步骤:
获取目标企业的各个待分析指标;
基于所述待分析指标搜索与所述目标企业相关的参考文本,根据所述参考文本得到所述目标企业的情绪关键词信息;
根据所述情绪关键词信息构建各个待分析指标的情感词语集;根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重;根据所述情绪权重得到各个待分析指标的情感趋势;
确定所述目标企业的业绩关联指标,根据所述业绩关联指标确定各个待分析指标中的多个参考指标;获取参考指标与所述业绩关联指标的关联度;根据所述关联度对各个参考指标的情感趋势进行调整,得到调整后的情感趋势;根据各个参考指标调整后的情感趋势综合评估所述目标企业的业绩趋势。
可选地,所述基于所述待分析指标搜索与所述目标企业相关的参考文本,根据所述参考文本得到所述目标企业的情绪关键词信息,包括:
确定与所述待分析指标相关联的二级指标,根据所述二级指标确定搜索范围;
基于所述搜索范围根据所述二级指标搜索与所述目标企业相关的参考文本;
根据所述参考文本得到所述目标企业的情绪关键词信息。
可选地,所述根据所述参考文本得到所述目标企业的情绪关键词信息,包括:
对所述参考文本进行词组提取,得到参考文章的文本信息以及初始关键词;
剔除所述多个参考关键词中干扰词,得到多个参考关键词;
根据所述文本信息和预设情绪词库对所述多个参考关键词进行情绪分类,得到各个参考关键词的词性;
根据所述各个参考关键词的词性和所述文本信息得到所述目标企业的情绪关键词信息。
可选地,所述根据所述文本信息和预设情绪词库对所述多个参考关键词进行情绪分类,得到各个参考关键词的词性,包括:
根据将预设情绪词库中带有情绪标签的词组与所述参考关键词进行匹配,得到初始情绪值;
根据所述文本信息中的标题以及邻近关键词的初始情绪值得到所述参考关键词的情绪修正值;
对所述参考关键词进行特征提取,得到关键词特征向量,根据预先建立的神经网络模型对所述关键词特征向量进行分类,得到预测情绪值;
根据所述初始情绪值、情绪修正值以及预测情绪值得到各个参考关键词的参考情绪值;
根据所述参考情绪值判断所述参考关键词的词性。
可选地,所述根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重,包括:
根据各个关键词信息中词性确定各个关键词的初始权重;
根据各个关键词信息中所述文本信息对所述初始权重进行调整得到参考权重;
根据所述情感词语集中各个情绪关键词信息的参考权重进行计算得到各个待分析指标的情感词语集的正向情绪权重和负向情绪权重;
根据所述正向情绪权重和所述负向情绪权重计算得到各个待分析指标的情绪偏置量;
根据所述情绪偏置量和各个关键词初始权重计算得到各个待分析指标的情绪权重。
此外,为实现上述目的,本发明还提出一种业绩趋势分析装置,所述业绩趋势分析装置包括:
参数获取模块,用于获取目标企业的各个待分析指标;
情感分析模块,用于基于所述待分析指标搜索与所述目标企业相关的参考文本,根据所述参考文本得到所述目标企业的情绪关键词信息;
所述情感分析模块,还用于根据所述情绪关键词信息构建各个待分析指标的情感词语集;根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重;根据所述情绪权重得到各个待分析指标的情感趋势;
业绩趋势分析模块,用于确定所述目标企业的业绩关联指标,根据所述业绩关联指标确定各个待分析指标中的多个参考指标;获取参考指标与所述业绩关联指标的关联度;根据所述关联度对各个参考指标的情感趋势进行调整,得到调整后的情感趋势;根据各个参考指标调整后的情感趋势综合评估所述目标企业的业绩趋。
此外,为实现上述目的,本发明还提出一种业绩趋势分析设备,所述业绩趋势分析设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业绩趋势分析程序,所述业绩趋势分析程序配置为实现如上文所述的业绩趋势分析方法的步骤。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有业绩趋势分析程序,所述业绩趋势分析程序被处理器执行时实现如上文所述的业绩趋势分析方法的步骤。
本发明通过采集与企业业绩相关的各个指标的文本内容得到关键词,识别各个关键词的情绪值,进一步计算各个指标的情绪值,得到各个指标对企业业绩的影响程度以及民众和/或市场对于企业业绩的情绪值,基于情绪值的大小和正负来判断企业业绩趋势,实现对企业业绩趋势更准确的分析。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的业绩趋势分析设备的结构示意图;
图2为本发明业绩趋势分析方法第一实施例的流程示意图;
图3为本发明业绩趋势分析方法第二实施例的流程示意图;
图4为本发明业绩趋势分析方法第一实施例的模型结构示意图;
图5为本发明业绩趋势分析装置第一实施例的结构框图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的业绩趋势分析设备结构示意图。
如图1所示,该业绩趋势分析设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对业绩趋势分析设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及业绩趋势分析程序。
在图1所示的业绩趋势分析设备中,网络接口1004主要用于与网络服务器进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明业绩趋势分析设备中的处理器1001、存储器1005可以设置在业绩趋势分析设备中,所述业绩趋势分析设备通过处理器1001调用存储器1005中存储的业绩趋势分析程序,并执行本发明实施例提供的业绩趋势分析方法。
本发明实施例提供了一种业绩趋势分析方法,参照图2,图2为本发明一种业绩趋势分析方法第一实施例的流程示意图。
本实施例中,所述业绩趋势分析方法包括以下步骤:
步骤S10:获取目标企业的各个待分析指标。
可理解的是,目标企业可以是需要进行业绩分析的企业,或者是需要进行业绩分析的店铺等,对业绩有要求的产业。
应理解的是,待分析指标可以包括目标企业的产品、金融、专利、企业报告、流水、政策等指标,待分析指标与企业的业绩息息相关,会随着企业的也就发生变化,同时也可以基于各个待分析指标预先对企业业绩进行评估、分析。
可理解的是,对于不同的企业,对企业业绩产生影响的指标也不相同,可以预先根据企业的类型分别设定关联的待分析指标。
需说明的是,目标企业各个待分析指标的获取可以是确定目标企业,在确定目标企业后确定目标企业的类型,例如服务类、科技发展类、实业类、重工类等,在确定要分析的企业类型后,根据各个类型企业预先设定的关联指标来确定确定目标企业的各个待分析指标。
在具体实施中,服务类的关联指标可能包括企业报告、金融走向、企业报告等关联指标;可理解的是,不同类型的目标企业的关联指标可以相同也可以不相同。
需要说明的是,本实施例的执行主体是业绩趋势分析设备,其中,该业绩趋势分析设备具有数据处理,数据通信及程序运行等功能,所述业绩趋势分析设备可以为集成控制器,控制计算机等设备,当然还可以为其他具备相似功能的设备,本实施例对此不做限制。
步骤S20:基于所述待分析指标搜索与所述目标企业相关的参考文本,根据所述参考文本得到所述目标企业的情绪关键词信息。
可理解的是,参考文本可以是与待分析指标相关的参考文本,例如网友评论、新闻报道、官方通知、报刊、微博、知乎其中的文本。
应理解的是,与待分析指标相关的参考文本可以是对文本内容进行识别,根据判断识别的文字内容中是否存在与目标企业、待分析指标以及二级指标相关的特征,若存在,则将改文本作为参考文本。
需说明的是,关键词信息可以包括文本信息和词性,文本信息可以是整个参考文本的标题、副标题、日期、期刊名称等与文本内容相关的信息;词性可以是识别各个词组在文本中是正向的含义还是负面的含义,或者是乱码,又或者是无意义介词或者是中性词,从参考文本的多个词组中挑选出带有强烈感情色彩(正向情绪或者是负向情绪)的词组可以作为关键词。
需强调的是,根据参考文本得到目标企业的情绪关键词信息需要先将参考文本进行文本分割,得到多个词语或者是段落,同时可以得到参考文本的标题、时间、名称等文本信息,进一步将各个词语和预先建立的具有词性标签的预设词库中的词语进行匹配,得到各个词组的词性。
需进一步强调的是,将各个词组和预设词库中词语进行匹配时还要考虑各个词组在参考文本中的上文信息,以及该词组邻近词组的词性综合进行匹配,最终得到该词组的词性。
步骤S30:根据所述情绪关键词信息构建各个待分析指标的情感词语集;根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重;根据所述情绪权重得到各个待分析指标的情感趋势。
可理解的是,情感词语集是各个待分析指标的情绪关键词的集合。
应理解的是,每个情绪关键词词性可以是0、-1、+1来表达,0表示为干扰词组或者是中性词组,-1可以表示为负面意义的词组,+1可以表示为正向意义的词组。
需说明的是,将待分析指标的情感词语集中的各个情绪关键词的词性综合计算得到该待分析指标的情感趋势。
可理解的是,根据所述情绪关键词信息构建各个待分析指标的情感词语集可以是将同一个待分析指标相关的情绪关键词信息作为一个集合,得到情感词语集。
其中,应理解的是,根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重可以根据该情感词语集中的正向词性词组的占比作为正向情绪权重,负向词性的词组的占比作为负向情绪权重,具体计算方式可以参考下列公式:
其中,ωp表示正向情绪权重,i表示正向词性词组的数量,j表示负向词性词组的数量,s表示中性词组的数量,且Pi表示正向词性词组的情绪值。其中Pi的计算公式可以参考下列公式:
Pi=|n|[ni-1,ni+1]
其中,n表示第i个词组的词性,n∈{-1,0,+1}。
进而情感趋势的计算可以参考下列公式:
θ=ωp·ip·np+ωj·ij·nj
需强调的是,所述根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重也可以是根据各个关键词信息中词性确定各个关键词的初始权重;根据各个关键词信息中所述文本信息对所述初始权重进行调整得到参考权重;根据所述情感词语集中各个情绪关键词信息的参考权重进行计算得到各个待分析指标的情感词语集的正向情绪权重和负向情绪权重;根据所述正向情绪权重和所述负向情绪权重计算得到各个待分析指标的情绪偏置量;根据所述情绪偏置量和各个关键词初始权重计算得到各个待分析指标的情绪权重。
其中,可理解的是,根据各个关键词信息中词性确定各个关键词的初始权重中的初始权重可以是正向关键词的数量在所有关键词中的占比。
其中,应理解的是,根据所述情感词语集中各个情绪关键词信息的参考权重进行计算得到各个待分析指标的情感词语集的正向情绪权重和负向情绪权重中的正向情绪权重和负向情绪权重可以理解为上述计算公式中的ωp和ωQ。
其中,需强调的是,可以直接根据各个词性词组数量占比得到正向情绪占比和负向情绪占比,也可以根据词性词组数量占比作为初始权重,再根据文本信息对初始权重进行调整。
其中,需说明的是,根据各个关键词信息中所述文本信息对所述初始权重进行调整得到参考权重可以是根据文本信息中标题中词组的词性设定参考文本的情感走向,例如参考文本中标题词性为正向,则基于这一词性将文本中的中性词组按照一定比例设定为正向词组,重新计算正向情绪权重和负向情绪权重,具体比例可以根据实际情况进行限定。
其中,需说明的是,情绪偏置可以是根据正向情绪权重和负向情绪权重的大小得到参考文本在整体上的情感趋势,正向情绪权重/负向情绪和各个关键词的初始权重相乘,能够让关键词的的情感更加极端,从而可以明确各个关键词的词性,从在后续可以更好的计算识别各个待分析指标的情感趋势。
步骤S40:确定所述目标企业的业绩关联指标,根据所述业绩关联指标确定各个待分析指标中的多个参考指标;获取参考指标与所述业绩关联指标的关联度;根据所述关联度对各个参考指标的情感趋势进行调整,得到调整后的情感趋势;根据各个参考指标调整后的情感趋势综合评估所述目标企业的业绩趋势。
可理解的是,目标企业的业绩趋势的分析结果可以是业绩上升和业绩下降两种分析结果。
可理解的是,获取参考指标与所述业绩关联指标的关联度可以是根据专家意见对每个类型的企业业绩相关的待分析指标可以是不同的,可以预先确定不同类型的企业业绩相关联的待分析指标。
其中,应理解的是,与企业业绩相关的各个待分析指标与企业业绩的关联程度也不相同,可以是预先根据专家意见设定各个待分析指标与企业业绩的关联度,也可以根据不同类型的企业,动态设定各个待分析指标的关联度,例如科技发展类企业,待分析指标“专利”的关联程度可以是较高0.4,相对于服务类企业,待分析指标“专利”的关联程度可以是0.15,也可以根据实际需求你进行调整,本实施例对此不作限定。
其中,需说明的是,目标企业的各个待分析指标有不同的情感趋势,将各个待分析指标的关联度与情感趋势相加,最终作为企业的情感趋势,情感趋势为负数则视为负向情感趋势,情感趋势为正数则视为正向情感趋势,其中将【-1,1】区间视为平稳区间,即情感趋势处于该区间时,则视为中性平稳情感趋势。
其中,需强调的是,根据各个参考指标调整后的情感趋势综合评估所述目标企业的业绩趋势可以简单理解为情感趋势的走向作为企业业绩趋势的走向。
本实施例通过采集与企业业绩相关的各个指标的文本内容得到关键词,识别各个关键词的情绪值,进一步计算各个指标的情绪值,得到各个指标对企业业绩的影响程度以及民众和/或市场对于企业业绩的情绪值,基于情绪值的大小和正负来判断企业业绩趋势,实现对企业业绩趋势更准确的分析。
参考图3,图3为本发明一种业绩趋势分析方法第二实施例的流程示意图。
基于上述第一实施例,本实施例业绩趋势分析方法在所述步骤S20,包括:
步骤S21:确定与所述待分析指标相关联的二级指标,根据所述二级指标确定搜索范围。
可理解的是,目标企业的待分析指标可以是一级指标,每个一级指标可以由多个二级指标得到,在对各个待分析指标进行情感分析时,可以针对各个二级指标进行情感分析,基于各个二级指标的情感值来计算一级指标的情感值。
需说明的是,产品、金融、专利、企业报告等待分析指标中产品的二级指标可以包括产品专利、产品差评、产品好评、产品销量等指标;金融的二级指标可以包括企业发展、企业股票涨跌、行业政策、同行业技术、关联企业等指标;企业报告可以包括目标企业报告、关联企业报告、投诉报告、奖励报告等、司法报告等指标,其他待分析指标不做赘述,可以根据在实际分析过程中的情况进行调整,本实施例对此不作限定。
应理解的是,不同的指标具有不同的搜索范围,例如政策这一指标搜索范围可以是各类报刊和官方账号发布的信息。
步骤S22:基于所述搜索范围根据所述二级指标搜索与所述目标企业相关的参考文本。
可理解的是,基于所述搜索范围根据所述二级指标搜索与所述目标企业相关的参考文本可以是指在执行的搜索范围内搜索包括二级指标的相关文本,并将搜索到的文本作为参考文本进行关键词提取和进一步分析。
步骤S23:根据所述参考文本得到所述目标企业的情绪关键词信息。
需说明的是,所述根据所述参考文本得到所述目标企业的情绪关键词信息,包括:对所述参考文本进行词组提取,得到参考文章的文本信息以及初始关键词;剔除所述多个参考关键词中干扰词,得到多个参考关键词;根据所述文本信息和预设情绪词库对所述多个参考关键词进行情绪分类,得到各个参考关键词的词性;根据所述各个参考关键词的词性和所述文本信息得到所述目标企业的情绪关键词信息。
其中,需说明的是,在对参考文本进行词组提取之前,可以先进行长文本关键信息提取,对长篇幅的文本进行精简,得到精简后的文本,在对精简后的文本进行词句提取。
其中,需说明的是,对所述参考文本进行词组提取,得到参考文章的文本信息以及初始关键词,剔除所述多个参考关键词中干扰词,得到多个参考关键词可以是通过词频(TF-IDF,Term Frequency-Inverse Document Frequency)算法,提取与标题相似度高的句子不仅能缩短文本长度剔除冗余信息,而且有助于模型更好地利用全局上下文信息。
其中,需强调的是,所述根据所述文本信息和预设情绪词库对所述多个参考关键词进行情绪分类,得到各个参考关键词的词性,包括:根据将预设情绪词库中带有情绪标签的词组与所述参考关键词进行匹配,得到初始情绪值;根据所述文本信息中的标题以及邻近关键词的初始情绪值得到所述参考关键词的情绪修正值;对所述参考关键词进行特征提取,得到关键词特征向量,根据预先建立的神经网络模型对所述关键词特征向量进行分类,得到预测情绪值;根据所述初始情绪值、情绪修正值以及预测情绪值得到各个参考关键词的参考情绪值;根据所述参考情绪值判断所述参考关键词的词性。
需进一步说明的是,可理解的,根据将预设情绪词库中带有情绪标签的词组与所述参考关键词进行匹配,得到初始情绪值可以是将预设情绪词库中各个词组的特征值与参考关键词的特征值进行相似度计算,相似度满足相似度阈值时,则认为是匹配成功,若存在多个匹配成功的词组,则以相似度最高的词组的标签作为参考关键词的初始情绪值,可理解的是,标签中的情绪值可以是一个具体的数值-15、-1、+8等。
需进一步说明的是,应理解的,根据所述文本信息中的标题以及邻近关键词的初始情绪值得到所述参考关键词的情绪修正值可以理解为将各个参考关键词按照参考文本的词组顺序进行排列,根据排列顺序下的各个参考关键词前后的情绪值对参考关键词的情绪值进行调整,例如前一个情绪值为+10,后一个情绪值为+8,参考关键词的初始情绪值为-20,为了避免文本中可能存在用反语的修辞描述,将前一个情绪值和后一个情绪值相加后除以2,求得平均值,将平均值作为情绪修正值,将初始情绪值加上情绪修正值实现对初始情绪的修正。
需进一步说明的是,需强调的,对所述参考关键词进行特征提取,得到关键词特征向量,根据预先建立的神经网络模型对所述关键词特征向量进行分类,得到预测情绪值可以是通过采集样本词组和样本文本信息并进行词性和情绪值的标签对神经网络进行训练,训练后的神经网络可以输出一个词组的预测情绪值,该神经网络可以是BERT(Bidirectional Encoder Representations from Transformers是一种预训练的语言模型,旨在解决自然语言处理任务,如问答、文本分类、文本相似度匹配等)模型和分类神经网络,分类神经网络可以是CNN神经网络,其中BERT模型的预测过程可以参考图4,其中E表示文本向量,T表示输出的情绪值;进一步的计算初始情绪值和预测情绪值之间的差值,将差值除以2对初始情绪值进行调整。
本实施例通过与所述待分析指标相关联的二级指标进行更加细致更有正对性的文本搜索,从而可以根据搜索内容进行词组提取,得到参考文章的文本信息以及初始关键词,根据预设情绪词库计算得到各个关键词的初始情绪值,更进一步通过预先训练好的神经网路预测情绪值,进一步,结合前后关键词的情绪值得到情绪修正值,通过多次修正,能够更加准确的针对参考文本的上下文信息对文本中的关键词的情绪值进行计算,从而可以计算出待分析指标更加准确的情绪值,实现从群众情绪价值中对企业的业绩趋势分析。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有业绩趋势分析程序,所述业绩趋势分析程序被处理器执行时实现如上文所述的业绩趋势分析方法的步骤。
参照图5,图5为本发明业绩趋势分析装置第一实施例的结构框图。
如图5所示,本发明实施例提出的业绩趋势分析装置包括:
参数获取模块10,用于获取目标企业的各个待分析指标;
情感分析模块20,用于基于所述待分析指标搜索与所述目标企业相关的参考文本,根据所述参考文本得到所述目标企业的情绪关键词信息;
所述情感分析模块20,还用于根据所述情绪关键词信息构建各个待分析指标的情感词语集;根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重;根据所述情绪权重得到各个待分析指标的情感趋势;
业绩趋势分析模块30,用于确定所述目标企业的业绩关联指标,根据所述业绩关联指标确定各个待分析指标中的多个参考指标;获取参考指标与所述业绩关联指标的关联度;根据所述关联度对各个参考指标的情感趋势进行调整,得到调整后的情感趋势;根据各个参考指标调整后的情感趋势综合评估所述目标企业的业绩趋。
本实施例通过采集与企业业绩相关的各个指标的文本内容得到关键词,识别各个关键词的情绪值,进一步计算各个指标的情绪值,得到各个指标对企业业绩的影响程度以及民众和/或市场对于企业业绩的情绪值,基于情绪值的大小和正负来判断企业业绩趋势,实现对企业业绩趋势更准确的分析。
在一实施例中,所述情感分析模块20,还用于确定与所述待分析指标相关联的二级指标,根据所述二级指标确定搜索范围;
基于所述搜索范围根据所述二级指标搜索与所述目标企业相关的参考文本;
根据所述参考文本得到所述目标企业的情绪关键词信息。
在一实施例中,所述情感分析模块20,还用于对所述参考文本进行词组提取,得到参考文章的文本信息以及初始关键词;
剔除所述多个参考关键词中干扰词,得到多个参考关键词;
根据所述文本信息和预设情绪词库对所述多个参考关键词进行情绪分类,得到各个参考关键词的词性;
根据所述各个参考关键词的词性和所述文本信息得到所述目标企业的情绪关键词信息。
在一实施例中,所述情感分析模块20,还用于根据将预设情绪词库中带有情绪标签的词组与所述参考关键词进行匹配,得到初始情绪值;
根据所述文本信息中的标题以及邻近关键词的初始情绪值得到所述参考关键词的情绪修正值;
对所述参考关键词进行特征提取,得到关键词特征向量,根据预先建立的神经网络模型对所述关键词特征向量进行分类,得到预测情绪值;
根据所述初始情绪值、情绪修正值以及预测情绪值得到各个参考关键词的参考情绪值;
根据所述参考情绪值判断所述参考关键词的词性。
在一实施例中,所述情感分析模块20,还用于根据各个关键词信息中词性确定各个关键词的初始权重;
根据各个关键词信息中所述文本信息对所述初始权重进行调整得到参考权重;
根据所述情感词语集中各个情绪关键词信息的参考权重进行计算得到各个待分析指标的情感词语集的正向情绪权重和负向情绪权重;
根据所述正向情绪权重和所述负向情绪权重计算得到各个待分析指标的情绪偏置量;
根据所述情绪偏置量和各个关键词初始权重计算得到各个待分析指标的情绪权重。
应当理解的是,以上仅为举例说明,对本发明的技术方案并不构成任何限定,在具体应用中,本领域的技术人员可以根据需要进行设置,本发明对此不做限制。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
应该理解的是,虽然本申请实施例中的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (8)
1.一种业绩趋势分析方法,其特征在于,所述业绩趋势分析方法包括:
获取目标企业的各个待分析指标;
基于所述待分析指标搜索与所述目标企业相关的参考文本,根据所述参考文本得到所述目标企业的情绪关键词信息;
根据所述情绪关键词信息构建各个待分析指标的情感词语集;根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重;根据所述情绪权重得到各个待分析指标的情感趋势;
确定所述目标企业的业绩关联指标,根据所述业绩关联指标确定各个待分析指标中的多个参考指标;获取参考指标与所述业绩关联指标的关联度;根据所述关联度对各个参考指标的情感趋势进行调整,得到调整后的情感趋势;根据各个参考指标调整后的情感趋势综合评估所述目标企业的业绩趋势。
2.如权利要求1所述的业绩趋势分析方法,其特征在于,所述基于所述待分析指标搜索与所述目标企业相关的参考文本,根据所述参考文本得到所述目标企业的情绪关键词信息,包括:
确定与所述待分析指标相关联的二级指标,根据所述二级指标确定搜索范围;
基于所述搜索范围根据所述二级指标搜索与所述目标企业相关的参考文本;
根据所述参考文本得到所述目标企业的情绪关键词信息。
3.如权利要求2所述的业绩趋势分析方法,其特征在于,所述根据所述参考文本得到所述目标企业的情绪关键词信息,包括:
对所述参考文本进行词组提取,得到参考文章的文本信息以及初始关键词;
剔除所述多个参考关键词中干扰词,得到多个参考关键词;
根据所述文本信息和预设情绪词库对所述多个参考关键词进行情绪分类,得到各个参考关键词的词性;
根据所述各个参考关键词的词性和所述文本信息得到所述目标企业的情绪关键词信息。
4.如权利要求3所述的业绩趋势分析方法,其特征在于,所述根据所述文本信息和预设情绪词库对所述多个参考关键词进行情绪分类,得到各个参考关键词的词性,包括:
根据将预设情绪词库中带有情绪标签的词组与所述参考关键词进行匹配,得到初始情绪值;
根据所述文本信息中的标题以及邻近关键词的初始情绪值得到所述参考关键词的情绪修正值;
对所述参考关键词进行特征提取,得到关键词特征向量,根据预先建立的神经网络模型对所述关键词特征向量进行分类,得到预测情绪值;
根据所述初始情绪值、情绪修正值以及预测情绪值得到各个参考关键词的参考情绪值;
根据所述参考情绪值判断所述参考关键词的词性。
5.如权利要求1所述的业绩趋势分析方法,其特征在于,所述根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重,包括:
根据各个关键词信息中词性确定各个关键词的初始权重;
根据各个关键词信息中所述文本信息对所述初始权重进行调整得到参考权重;
根据所述情感词语集中各个情绪关键词信息的参考权重进行计算得到各个待分析指标的情感词语集的正向情绪权重和负向情绪权重;
根据所述正向情绪权重和所述负向情绪权重计算得到各个待分析指标的情绪偏置量;
根据所述情绪偏置量和各个关键词初始权重计算得到各个待分析指标的情绪权重。
6.一种业绩趋势分析装置,其特征在于,所述业绩趋势分析装置包括:
参数获取模块,用于获取目标企业的各个待分析指标;
情感分析模块,用于基于所述待分析指标搜索与所述目标企业相关的参考文本,根据所述参考文本得到所述目标企业的情绪关键词信息;
所述情感分析模块,还用于根据所述情绪关键词信息构建各个待分析指标的情感词语集;根据所述情感词语集中各个情绪关键词信息得到各个待分析指标的情绪权重;根据所述情绪权重得到各个待分析指标的情感趋势;
业绩趋势分析模块,用于确定所述目标企业的业绩关联指标,根据所述业绩关联指标确定各个待分析指标中的多个参考指标;获取参考指标与所述业绩关联指标的关联度;根据所述关联度对各个参考指标的情感趋势进行调整,得到调整后的情感趋势;根据各个参考指标调整后的情感趋势综合评估所述目标企业的业绩趋。
7.一种业绩趋势分析设备,其特征在于,所述设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的业绩趋势分析程序,所述业绩趋势分析程序配置为实现如权利要求1至5中任一项所述的业绩趋势分析方法。
8.一种存储介质,其特征在于,所述存储介质上存储有业绩趋势分析程序,所述业绩趋势分析程序被处理器执行时实现如权利要求1至5任一项所述的业绩趋势分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410059994.8A CN117764458A (zh) | 2024-01-15 | 2024-01-15 | 业绩趋势分析方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410059994.8A CN117764458A (zh) | 2024-01-15 | 2024-01-15 | 业绩趋势分析方法、装置、设备及存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN117764458A true CN117764458A (zh) | 2024-03-26 |
Family
ID=90318458
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410059994.8A Pending CN117764458A (zh) | 2024-01-15 | 2024-01-15 | 业绩趋势分析方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN117764458A (zh) |
Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201308244A (zh) * | 2011-08-12 | 2013-02-16 | Get Man Consultants | 公司經營績效與高階薪酬分析之線上查詢運算模式 |
CN105740228A (zh) * | 2016-01-25 | 2016-07-06 | 云南大学 | 一种互联网舆情分析方法 |
KR20210001686A (ko) * | 2019-06-28 | 2021-01-06 | 주식회사 자이냅스 | 뉴스 기사 레이블링 기반 기업 부실 예측 정보 서비스 제공 프로그램 |
WO2021217843A1 (zh) * | 2020-04-29 | 2021-11-04 | 平安科技(深圳)有限公司 | 企业舆情分析方法、装置、电子设备及介质 |
CN114692944A (zh) * | 2022-02-14 | 2022-07-01 | 首都经济贸易大学 | 一种基于多特征指标的股票趋势预测方法 |
CN115965030A (zh) * | 2022-12-31 | 2023-04-14 | 山东山科数字经济研究院有限公司 | 一种区域数据监测方法和系统 |
-
2024
- 2024-01-15 CN CN202410059994.8A patent/CN117764458A/zh active Pending
Patent Citations (6)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
TW201308244A (zh) * | 2011-08-12 | 2013-02-16 | Get Man Consultants | 公司經營績效與高階薪酬分析之線上查詢運算模式 |
CN105740228A (zh) * | 2016-01-25 | 2016-07-06 | 云南大学 | 一种互联网舆情分析方法 |
KR20210001686A (ko) * | 2019-06-28 | 2021-01-06 | 주식회사 자이냅스 | 뉴스 기사 레이블링 기반 기업 부실 예측 정보 서비스 제공 프로그램 |
WO2021217843A1 (zh) * | 2020-04-29 | 2021-11-04 | 平安科技(深圳)有限公司 | 企业舆情分析方法、装置、电子设备及介质 |
CN114692944A (zh) * | 2022-02-14 | 2022-07-01 | 首都经济贸易大学 | 一种基于多特征指标的股票趋势预测方法 |
CN115965030A (zh) * | 2022-12-31 | 2023-04-14 | 山东山科数字经济研究院有限公司 | 一种区域数据监测方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
Liu et al. | Assessing product competitive advantages from the perspective of customers by mining user-generated content on social media | |
US11699035B2 (en) | Generating message effectiveness predictions and insights | |
Coussement et al. | Integrating the voice of customers through call center emails into a decision support system for churn prediction | |
US11972207B1 (en) | User interface for use with a search engine for searching financial related documents | |
Thorleuchter et al. | Predicting e-commerce company success by mining the text of its publicly-accessible website | |
CN104781837B (zh) | 用于通过使用基于事件的情绪分析来形成预测的系统和方法 | |
US11257161B2 (en) | Methods and systems for predicting market behavior based on news and sentiment analysis | |
Thorleuchter et al. | Analyzing existing customers’ websites to improve the customer acquisition process as well as the profitability prediction in B-to-B marketing | |
US11941714B2 (en) | Analysis of intellectual-property data in relation to products and services | |
US11205237B2 (en) | Analysis of intellectual-property data in relation to products and services | |
US11803927B2 (en) | Analysis of intellectual-property data in relation to products and services | |
US11348195B2 (en) | Analysis of intellectual-property data in relation to products and services | |
US20210004918A1 (en) | Analysis Of Intellectual-Property Data In Relation To Products And Services | |
Law et al. | Knowledge-driven decision analytics for commercial banking | |
JP2022538925A (ja) | 製品およびサービスに関連する知的所有権データの分析 | |
Chen et al. | Forecasting corporate credit ratings using big data from social media | |
Pagliaro et al. | Investor behavior modeling by analyzing financial advisor notes: a machine learning perspective | |
Kumar et al. | A weighted sum method MCDM approach for recommending product using sentiment analysis | |
Duman | Social media analytical CRM: a case study in a bank | |
Zhang et al. | Predicting temporary deal success with social media timing signals | |
Park et al. | Automatic Construction of Context-Aware Sentiment Lexicon in the Financial Domain Using Direction-Dependent Words | |
Schwartz et al. | Assessing objective recommendation quality through political forecasting | |
Pataci et al. | Stock price volatility prediction: A case study with AutoML | |
CN117764458A (zh) | 业绩趋势分析方法、装置、设备及存储介质 | |
CN114169418A (zh) | 标签推荐模型训练方法及装置、标签获取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |