CN109993448A - 一种企业网络舆情潜在风险的评估方法及系统 - Google Patents

一种企业网络舆情潜在风险的评估方法及系统 Download PDF

Info

Publication number
CN109993448A
CN109993448A CN201910277297.9A CN201910277297A CN109993448A CN 109993448 A CN109993448 A CN 109993448A CN 201910277297 A CN201910277297 A CN 201910277297A CN 109993448 A CN109993448 A CN 109993448A
Authority
CN
China
Prior art keywords
network
enterprise
value
reputation
opinion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910277297.9A
Other languages
English (en)
Inventor
阮爽
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hubei Fengkou Network Technology Co Ltd
Original Assignee
Hubei Fengkou Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hubei Fengkou Network Technology Co Ltd filed Critical Hubei Fengkou Network Technology Co Ltd
Priority to CN201910277297.9A priority Critical patent/CN109993448A/zh
Publication of CN109993448A publication Critical patent/CN109993448A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/06Resources, workflows, human or project management; Enterprise or organisation planning; Enterprise or organisation modelling
    • G06Q10/063Operations research, analysis or management
    • G06Q10/0635Risk analysis of enterprise or organisation activities
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明实施例提供一种企业网络舆情潜在风险的评估方法及系统,该方法包括基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;基于正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并基于网络声誉破产违约距离得到企业的网络声誉破产概率,根据网络声誉破产概率得到企业网络声誉潜在风险值。本发明实施例提供的企业网络舆情潜在风险的评估方法及系统通过上述网络舆情潜在风险评估值来反应企业目前所处的网络舆情环境中的网络声誉破产的潜在风险,以一种灵活和稳健的方式发现、捕捉到网络舆情环境中企业声誉可能存在的变化,并对该变化即网络声誉破产的潜在风险做出预测和评估。

Description

一种企业网络舆情潜在风险的评估方法及系统
技术领域
本发明涉及互联网安全技术领域,更具体地,涉及一种企业网络舆情潜在风险的评估方法及系统。
背景技术
公司或消费者往往会通过论坛、博客以及公众号等网络平台和其他网民共同分享的关于公司的产品或服务的文字、图片、视频以及其他各类多媒体信息,而这些多媒体信息经过网络大量传播后,会影响到公司品牌的信誉度,也就是网络口碑或网络舆情,从而对公司的发展产生一定程度的影响。
在互联网各种平台上传播的网络舆情有正面的也有负面的,正面网络舆情有利于扩大公司品牌的影响力,推动公司的发展,而负面网络舆情会破坏公司的品牌,给公司的发展带来不利的影响。由于互联网的信息数量庞大,且传播迅速,难免会出现一些关于企业的负面网络舆情,但这些负面网络舆情会影响消费者对于企业以及其产品的印象和评价,且这些负面网络舆情给企业带来的潜在风险是始终存在的,无论公关经验多么丰富的企业都有或多或少的潜在风险存在,而这些潜在危险如果没有及时发现,一旦通过互联网形成规模,很有可能危及到企业的生命。
因此在多媒体信息通过互联网大规模快速传播的时代,企业想要得到发展就需要时刻预防和及时发现网络舆情带来的潜在危险,避免危险爆发危机企业生命,如此企业对网络舆情带来的潜在危险的评估变得十分重要。
发明内容
本发明提供一种克服上述问题或者至少部分地解决上述问题的一种企业网络舆情潜在风险的评估方法及系统,解决了现有技术中企业对网络舆情带来的潜在危险的评估需求的技术问题。
第一个方面,本发明实施例提供一种企业网络舆情潜在风险的评估方法,包括:
基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;
基于所述正面网络舆情值和所述负面网络舆情值预测企业的网络声誉破产违约距离,并基于所述网络声誉破产违约距离得到企业的网络声誉破产概率,根据所述网络声誉破产概率得到企业网络声誉潜在风险值。
作为优选的,在所述基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值前还包括:
获取与企业相关的网络评价报告,并识别所述网络评价报告中的情感信息关键词,基于所述情感信息关键词将所述网络评价报告分为网络正面评价和网络负面评价。
作为优选的,在所述基于所述情感信息关键词将所述网络评价文件分为网络正面评价和网络负面评价后还包括:
获取所述网络评价报告的阅读量,基于所述阅读量分配所述网络评价报告的权重值,并根据每个网络正面评价及其对应的权重值得到正面网络舆情值,根据每个负面网络评价及其对应的权重值得到网络负面舆情值。
作为优选的,在所述基于所述正面网络舆情值和所述负面网络舆情值预测企业的网络声誉破产违约距离,具体包括:
获取企业当日前包括当日在内的连续N日的正面网络舆情值和负面网络舆情值,并计算网络声誉破产违约距离:
网络声誉破产违约距离=(N日正面网络舆情值之和-N日负面网络舆情值之和)/当日正面网络舆情值*(N日正面网络舆情值的方差)。
作为优选的,所述基于所述网络声誉破产违约距离得到企业的网络声誉破产概率,具体包括:
基于连续多日网络声誉破产违约距离的正态分布状况得到网络声誉破产概率。
作为优选的,在所述根据所述网络声誉破产概率得到企业网络声誉潜在风险值前,还包括:
对企业的历史网络声誉破产概率和企业置信值进行训练,得到企业网络声誉潜在风险值的风险系数。
作为优选的,根据所述网络声誉破产概率得到企业网络声誉潜在风险值,具体包括:
Q=n*totle*Sqrt*Math.Sqrt(averlt*maxtimes*realweek/24/forward);
式中,Q为企业网络声誉潜在风险值,n为企业网络声誉潜在风险值的风险系数,totle为N日负面网络舆情值之和,Sqrt为N日负面网络舆情值的方差,Math.Sqrt()为开平方;averl为相邻两次负面网络舆情值超过N日平均值的间隔时间,maxtimes为连续M日负面网络舆情值超过N日平均值的次数,realweek为从实际抓到数据的那天起截止到当日的周数,forward=365。
作为优选的,还包括:
计算企业的网络声誉隐含风险值:Y=MB+p*MD;
式中,Y为网络声誉隐含风险值,MB为(N-1)日负面网络舆情值的均值,MD为N日的负面网络舆情值的标准差,P=1.618。
作为优选的,在所述基于企业的网络负面评价得到负面网络舆情值之后还包括:
计算企业的破产临界值:P=α+β*(N日负面网络舆情值之和);
式中,P为企业的破产临界值,α=45.6,β=1.2。
第二个方面,本发明实施例提供一种企业网络舆情潜在风险的评估系统,包括:
第一处理模块,用于基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;
第二处理模块,用于基于所述正面网络舆情值和所述负面网络舆情值预测企业的网络声誉破产违约距离,并基于所述网络声誉破产违约距离得到企业的网络声誉破产概率,根据所述网络声誉破产概率得到企业网络声誉潜在风险值。
本发明实施例提供的一种企业网络舆情潜在风险的评估方法及系统采用对网络中有关企业的网络评价进行量化处理得到网络舆情值,量化正面网络评价得到正面网络舆情值,量化负面网络评价得到负面网络舆情值,然后通过正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并通过网络声誉破产违约距离得到企业的网络声誉破产概率,最后通过网络声誉破产概率得到企业网络声誉潜在风险值,如此通过这些网络舆情潜在风险评估值来反应企业目前所处的网络舆情环境中的网络声誉破产的潜在风险,以一种灵活和稳健的方式发现、捕捉到网络舆情环境中企业声誉可能存在的变化,并对该变化即网络声誉破产的潜在风险做出预测和评估。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的企业网络舆情潜在风险的评估方法流程示意图;
图2为本发明实施例提供的企业网络舆情潜在风险评估系统结构示意图;
图3为本发明实施例提供的电子设备的实体结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在现在互联网技术普遍应用的时代,各种类型的多媒体信息通过互联网平台能够得到大规模迅速的传播,其中有关企业声誉的评论信息也是如此,尤其知名度越高的企业,与其有关的评论信息传播的更是迅速,关注度越高,网络舆情对企业声誉的影响就越大。尤其是负面网络舆情通过互联网平台经过公众媒体以及个体的大量转发,在网络平台上一旦形成热点信息,这将是企业的灾难,会严重影响企业声誉甚至影响到企业的发展和生命。
然而很多的负面网络舆情都是隐性的,企业正常运行时,这些负面网络舆情并不会表现的出来,或者表现的不那么明显,其对企业的声誉以及发展并没有产生多大影响。但是,当企业遇到危机时,这些平时掩盖起来的风险就会暴露出来,并在关键时候推波助澜使得企业产生更大危机,以致产生不可避免的重大损失。而且对于企业来讲,这些由负面网络舆情带来的潜在风险始终存在的,无论公关经验多么好的企业都会有或多或少的风险存在。特别是在互联网广泛应用的环境下,无论企业是否开展网络活动都难以避免负面网络舆情问题。
而且数据表明,大部分时候,企业的网络舆情是正面的,负面的网络舆情很少。但是当风险发生时,负面网络舆情可能会迅速增加,正面网络舆情可能会下降。当负面网络舆情发展到一定程度的时候就会危及企业声誉甚至生命。因此在企业正常运行时对网络舆情的监测也是非常重要的,这不仅仅关乎风险来临时如何应对,更重要的是在平时如何从这种看起来风平浪静的网络舆情中发现可能潜在的声誉风险,并积极的做出相应的策略。
那么,如何从平时风平浪静的网络舆情中发现并预测、评估破坏企业声誉的潜在风险变的非常重要。
为了解决上述在风平浪静的网络舆情中发现并预测、评估破坏企业声誉的潜在风险的问题,本发明实施例提供了一种企业网络舆情潜在风险的评估方法,图1为本发明实施例提供的企业网络舆情潜在风险的评估方法流程示意图,如图1所示,该方法包括:
步骤10、基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;
步骤11、基于正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并基于网络声誉破产违约距离得到企业的网络声誉破产概率,根据网络声誉破产概率得到企业网络声誉潜在风险值。
具体地,本发明实施例提供的企业网络舆情潜在风险的评估方法具体为量化有关企业的网络评价为网络舆情值,网络舆情值为能够表征有关企业网络评价对该企业声誉产生影响的数值,正面网络舆情值为表征正面网络评价对企业声誉产生影响的正面网络舆情数值,负面网络舆情值为表征负面网络评价对企业声誉产生影响的负面网络舆情数值,其中量化有关企业的网络评价为网络舆情值可通过该网络评价对企业声誉的影响程度进行比较量化,例如可以先将网络评价对企业声誉的影响程度进行打分分级比如0~9等,影响程度小则打分低,影响程度大则打分高。
然后量化有关企业的网络评价得到正面网络舆情值和负面网络舆情值后,根据正面网络舆情值和负面网络舆情值预测企业网络声誉破产违约距离,网络声誉破产违约距离为预测到的企业声誉破产的日期距离预测当日的时间,根据网络声誉破产违约距离得到网络声誉破产概率,网络声誉破产概率为企业网络声誉在预测的网络声誉破产日期到时网络声誉破产的概率大小,例如通过预测得出企业网络声誉破产违约距离为6个月,其相应地网络声誉破产的概率为2%。
最后根据网络声誉破产概率得到企业网络声誉潜在风险值,企业网络声誉潜在风险值为当预测的负面网络舆情值增长到与正面网络舆情值相等时的负面网络舆情值的大小,因为正常情况下,企业正面网络舆情值很大、负面网络舆情值很小或者没有时企业声誉肯定是好的。相反企业声誉肯定是不好的,而当企业负面网络舆情值上升到与企业正面网络舆情值重合时,说明负面网络舆情值过高,企业声誉到了一个临界状态即企业声誉要破产了。如此通过上述企业网络舆情潜在风险的评估方法得到能够表征企业网络声誉潜在风险的风险评估指标即网络声誉破产违约距离、网络声誉破产概率以及网络声誉潜在风险值。
本发明实施例提供的企业网络舆情潜在风险的评估方法采用对网络中有关企业的网络评价进行量化处理得到网络舆情值,量化正面网络评价得到正面网络舆情值,量化负面网络评价得到负面网络舆情值,然后通过正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并通过网络声誉破产违约距离得到企业的网络声誉破产概率,最后通过网络声誉破产概率得到企业网络声誉潜在风险值,如此通过这些网络舆情潜在风险评估值来反应企业目前所处的网络舆情环境中的网络声誉破产的潜在风险,以一种灵活和稳健的方式发现、捕捉到网络舆情环境中企业声誉可能存在的变化,并对该变化即网络声誉破产的潜在风险做出预测和评估。
在上述实施例的基础上,本发明提供的企业网络舆情潜在风险的评估方法中的基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值前还包括:
获取与企业相关的网络评价报告,并识别网络评价报告中的情感信息关键词,基于情感信息关键词将网络评价报告分为网络正面评价和网络负面评价,其中网络评价报告可为媒体文件或文本文件,其中媒体文件包括语音、视频或者图片等。对于网络评价报告中的情感信息关键词可通过文字识别或语音识别来提取,例如网络评价报告为微博短文或网页评论等文字评价时,其中对企业的评价里出现喜欢或不喜欢等这样的情感信息词汇时,可将喜欢或不喜欢等能够代表对企业态度的词汇通过计算机文字识别提取出来,根据其态度将该评价分为正面评价或负面评价,以此来实现对网络评价报告中关于企业正负面评价的区分。
互联网上80%以上的信息是以文本方式呈现的,网上的用户评论尤其如此。这些信息就需要所谓的“自然语言处理技术”来进行处理。网络文本信息中包含了客观陈述和主观陈述,如果对主观陈述中所包含的情感进行分析,则是自然语言处理方面最活跃的一个研究方向:“情感分析SA(SentimentAnalysis,情感分析)”,这一研究方向主要关注所处理的信息中的意见、情感和主观性。在各种情感分析中,对情感的正负面进行分析判定,是目前为止情感分析方面最主要的任务,也叫做“极性分析”。极性分析可以被看作是这样一个任务:“对于给定的一段带有观点的评论性文本,标记出它是整体正面评价或者整体负面评价”。通俗来说也就是标记某一段评论性文字所代表的倾向性情感是正面还是负面,对所表达的主题是喜爱还是讨厌,是赞同还是反对等等。
在本实施例中,不仅仅针对网络中的文本信息,还增加了对多媒体文件信息的识别区分,采集范围更加广泛、更加全面。
具体地,在文本识别时,需要完成以下工作:
一、通过计算机系统分辨出哪些文件或文件的哪一部分能够表达真实的主观信息;
对文章或者评论进行检测,分析出带有主观意见的句子;
对这个句子进行细分,提取主题、意见发起者、相关意见等,并对这些意见进行正负面分析或者极性分类。
二、基于原始文本中提取的主观信息,进一步提取其所表达的意见,确定主观信息中包含有哪些内容,以及他们之间的关系:
要素一:主题提取:提取带有评述性的观点以及它表述的主题有哪些方面;
要素二:观点持有者识别:确定持有这些评述性观点的人;
要素三:陈述的选择:鉴别哪些是观点持有者发布的意见,然后去除其他人的陈述;
以上三个要素是为了让计算机准确地选择某一个人对某一个主题的观点。
三、对这一观点进行正负面分析。
四、舆论分析:理解主观表述的倾向,即观点的正负面分析,其包括如下几种分析方式。
1.“将舆论归入到情感极性中的正面或负面”,这个问题被称为极性分类;
2.“在正负面两个极端之间确定它的强度”,这个问题被称为序列回归;
3.提取意见的同时也提取出现这个意见的原因;系统不仅可以分析“用户是否喜欢它以及用户到底有多么强烈地喜欢它”,而且还能分析“我们的用户为什么喜欢它”;
4.文本分类的观点,有点像美国政治人士的政治立场:“自由”或“保守”。
具体地,在本实施例中,对正面评价和负面评价进行极性分类具体包括:
第一步,特征提取方法。它将原始文档的主观态度转化为机器可以识别的符号化的句子或陈述。通俗来说就是通过计算机系统的设定,用某种方式对网络上的文字进行识别和提取具有正负面倾向性的内容。这一步是极性分类效果好坏最关键的一步。
第二步,分类,当前主要运用标准的机器学习分类器,比如被广泛应用的支持向量机SVM(Support VectorMachines,支持向量机),对已经提取并数据化表示的特征向量进行正负面分类。简言之,就是将第一步提取出来的具有正负面倾向性的内容,通过计算方式进行比对和分类,确认出这段文章的情感倾向是正面的还是负面的。
第三步,输出结果。
在本实施例中,利用极性分类的巨大商业价值和公共服务价值。基于现有客户的正负面评论帮助厂家了解消费者意见并加以改进,如此可以极大地影响潜在客户的购买意向。而如此大量的调查如果是人为进行的话将非常费时费力,成本极高,情感分析技术特别是极性分类技术的产生,极好地满足了客户这一潜在的巨大需求。
网络评价和信息的正负面识别,都是通过极性分类(polarity classification)这一步骤来实现,极性分类首先将具有情感倾向的相关词语提取出来,叫做“特征提取”(feature extraction)。简单来说,如何通过计算机判别正负面,就是通过提取句子中的正负面词语,通过词语的正负面来判断文章的正负面倾向。
上述特征提取方法来进行极性分类主要以基于语义特征的特征提取模式为主,即根据词语表达的意思,也就是根据字面意思来辨析句子所表达的正负面,其中主要运用人工建构情感词条的方法来进行。
即通过识别特定主题词和语气表达式之间的语义关系进行倾向性分析,采用自然语言处理技术分析特定主题和语气词之间的语义关联。具体方法如下:
第一步,首先手动构建了一个有3513个词条的情感词汇表。字典中每个词语都包括情感,词性标记和规范形式的情感词,比如(好,词性标记为正面,恶劣,词性标记为负面)。如果收录的情感词是一个动词,只要通过这一动词产生了情感,该动词的宾语也将会被收录。
第二步,使用一些计算机工具(两个PoS-tags(Part-of-speech tagging,词性标注)和一个句子结构解析器),可以识别短语边界和局部依赖性,比如针对“我喜欢打球!”这个句子,通过工具可以识别短语边界为“打球”,“喜欢打球”,“我喜欢打球”,并且还可以分析出“打”的对象是“球”,“喜欢”的对象是“打球”这种短语之间的依赖关系,针对每一个句子他们只提取一个代表性的情感词,当一个句子中存在多个情感词时,这种方式就不够好用。
第三步,将提取出来的情感词,放到之前人工构建的情感词典里检索,找到情感词典中对应的词语以及它的正负面极性。这样就完成了一个文本片段的情感极性判断。
通过以上方法,实验的准确率(精度)大约是75%-95%,但相对检索内容的查全率(召回率)较低,只有20%-25%。也就是说,实验检索结果整体是非常准确的。
因为有来自于手工设定的情感词汇表,这种算法可以分析形容词、副词、名词和动词的情感极性,此外还能理解否定句和被动句。而且这种方法不仅可以分析情感正负面,还可以提取出正负面所对应的主题。
在上述实施例的基础上,本发明提供的企业网络舆情潜在风险的评估方法中的基于情感信息关键词将网络评价文件分为网络正面评价和网络负面评价后还包括:
获取网络评价报告的阅读量,基于阅读量分配网络评价报告的权重值,并根据每个网络正面评价及其对应的权重值得到正面网络舆情值,根据每个负面网络评价及其对应的权重值得到网络负面舆情值,其中网络评价报告的阅读量为网络评价报告的打开阅读次数或打开阅读时间等,该网络评价报告被打开阅读次数越多、打开阅读时间越长,其对应的网络评价报告的权重值就越大,相应的根据该网络评价报告得到的网络评价的权重值也就越大,其中如果网络评价是正面网络评价则正面网络舆情值的权重值就越大,如果网络评价是负面网络评价则负面网络舆情值的权重值就越大。
在上述各实施例的基础上,本发明提供的企业网络舆情潜在风险的评估方法中的基于正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,具体包括:
获取企业当日前包括当日在内的连续N日的正面网络舆情值和负面网络舆情值,并计算网络声誉破产违约距离:
网络声誉破产违约距离=(N日正面网络舆情值之和-N日负面网络舆情值之和)/当日正面网络舆情值*(N日正面网络舆情值的方差)。即在得到企业网络舆情潜在风险评估当日以及当日前N-1天,总共N天的正面网络舆情值之和以及负面网络舆情值之和,通过上述计算得出的值为网络声誉破产违约距离即预测到的企业声誉破产的日期距离预测当日的时间。
在上述各实施例的基础上,本发明提供的企业网络舆情潜在风险的评估方法中的基于网络声誉破产违约距离得到企业的网络声誉破产概率,具体包括:
基于连续多日网络声誉破产违约距离的正态分布状况得到网络声誉破产概率。即在上述各实施例的基础上,得到网络声誉破产违约距离后,其正太分布中的对应的概率值即为网络声誉破产违约距离对应的网络声誉破产概率。
在上述各实施例的基础上,本发明提供的企业网络舆情潜在风险的评估方法中的根据网络声誉破产概率得到企业网络声誉潜在风险值前,还包括:
对企业的历史网络声誉破产概率和企业置信值进行训练,得到企业网络声誉潜在风险值的风险系数,企业网络声誉潜在风险值的风险系数为企业网络声誉潜在风险值计算所需要的风险系数值,网络声誉破产概率和企业置信值不同的对应的关系,风险系数则不同,例如风险系数为n时,n的值根据网络声誉破产概率的大小进行取值,即网络声誉破产概率与1减去企业置信值后得到的数值进行比较,然后根据比较结果取相应的值,具体如下:
当企业置信值取0.01、网络声誉破产概率==1-0.01时,n=2.23;
当企业置信值取0.03、网络声誉破产概率==1-0.03时,n=1.96;
当企业置信值取0.05、网络声誉破产概率==1-0.05时,n=1.645;
当企业置信值取0.1、网络声誉破产概率==1-0.1时,n=1.29;
当企业置信值取0.2、网络声誉破产概率==1-0.2时,n=0.85;
当企业置信值取0.3、网络声誉破产概率==1-0.3时,n=0.53;
当企业置信值取0.4、网络声誉破产概率==1-0.4时,n=0.26。
其中,企业置信值增大时,企业网络声誉潜在风险值的风险系数减小。
在上述实施例的基础上,本发明提供的企业网络舆情潜在风险的评估方法中的根据网络声誉破产概率得到企业网络声誉潜在风险值,具体包括:
Q=n*totle*Sqrt*MathSqrt(averlt*maxtimes*realweek/24/forward);
式中,Q为企业网络声誉潜在风险值,n为企业网络声誉潜在风险值的风险系数,totle为N日负面网络舆情值之和,Sqrt为N日负面网络舆情值的方差,MathSqrt为平方根;averl为相邻两次负面网络舆情值超过N日平均值的间隔时间,maxtimes为连续M日负面网络舆情值超过N日平均值的次数,realweek为从实际抓到数据的那天起截止到当日的周数,forward=365,在上述实施例的基础上,将上述实施例中得到的企业网络声誉潜在风险值的风险系数n代入公式中,得到企业网络声誉潜在风险值,从而对企业网络舆情潜在风险进行评估。
其中在上述实施例的基础上得到企业网络声誉潜在风险值与网络声誉破产概率的关系,企业网络声誉潜在风险值与网络声誉破产概率为类似反比的关系,具体需要数据训练得出,即企业网络声誉潜在风险值越大,网络声誉破产概率就越小。如此通过企业网络声誉潜在风险值与网络声誉破产概率可以预测企业声誉破产临界状态,还可以帮助企业做相对应的决策判断。
在上述各实施例的基础上,本发明提供的企业网络舆情潜在风险的评估方法还包括:
计算企业的网络声誉隐含风险值:Y=MB+p*MD;
式中,Y为网络声誉隐含风险值,MB为(N-1)日负面网络舆情值的均值,MD为N日的负面网络舆情值的标准差,P=1.618。
在上述各实施例的基础上,本发明提供的企业网络舆情潜在风险的评估方法中的基于企业的网络负面评价得到负面网络舆情值之后还包括:
计算企业的破产临界值:P=α+β*N日负面网络舆情值之和;
式中,P为企业的破产临界值,α=45.6,β=1.2。
本发明实施例还提供了一种企业网络舆情潜在风险的评估系统,图2为本发明实施例提供的企业网络舆情潜在风险评估系统结构示意图,如图2所示,该系统包括第一处理模块41和第二处理模块42,其中第一处理模块41,用于基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;第二处理模块42,用于基于正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并基于网络声誉破产违约距离得到企业的网络声誉破产概率,根据网络声誉破产概率得到企业网络声誉潜在风险值。
具体地,本发明实施例提供的企业网络舆情潜在风险的评估系统包括第一处理模块41和第二处理模块42,其中第一处理模块41量化有关企业的网络评价为网络舆情值,网络舆情值为能够表征有关企业网络评价对该企业声誉产生影响的数值,正面网络舆情值为表征正面网络评价对企业声誉产生影响的正面网络舆情数值,负面网络舆情值为表征负面网络评价对企业声誉产生影响的负面网络舆情数值,其中第一处理模块21量化有关企业的网络评价为网络舆情值可通过该网络评价对企业声誉的影响程度进行比较量化,例如可以先将网络评价对企业声誉的影响程度进行打分分级比如0~9等,影响程度小则打分低,影响程度大则打分高。
然后第一处理模块41量化有关企业的网络评价得到正面网络舆情值和负面网络舆情值后,第二处理模块42根据正面网络舆情值和负面网络舆情值预测企业网络声誉破产违约距离,网络声誉破产违约距离为预测到的企业声誉破产的日期距离预测当日的时间,根据网络声誉破产违约距离得到网络声誉破产概率,网络声誉破产概率为企业网络声誉在预测的网络声誉破产日期到时网络声誉破产的概率大小,例如经预测得出企业网络声誉破产违约距离为6个月,其相应地网络声誉破产的概率为2%。
最后第二处理模块42根据网络声誉破产概率得到企业网络声誉潜在风险值,该企业网络声誉潜在风险值为当预测的负面网络舆情值增长到与正面网络舆情值相等时的负面网络舆情值的大小,因为正常情况下,企业正面网络舆情值很大、负面网络舆情值很小或者没有时企业声誉肯定是好的。相反企业声誉肯定是不好的,而当企业负面网络舆情值上升到与企业正面网络舆情值重合时,说明负面网络舆情值过高,企业声誉到了一个临界状态即企业声誉要破产了。如此通过上述企业网络舆情潜在风险的评估方法得到能够表征企业网络声誉潜在风险的风险评估指标即网络声誉破产违约距离、网络声誉破产概率以及网络声誉潜在风险值。
本发明实施例提供的企业网络舆情潜在风险的评估系统采用对网络中有关企业的网络评价进行量化处理得到网络舆情值,量化正面网络评价得到正面网络舆情值,量化负面网络评价得到负面网络舆情值,然后通过正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并通过网络声誉破产违约距离得到企业的网络声誉破产概率,最后通过网络声誉破产概率得到企业网络声誉潜在风险值,如此通过这些网络舆情潜在风险评估值来反应企业目前所处的网络舆情环境中的网络声誉破产的潜在风险,以一种灵活和稳健的方式发现、捕捉到网络舆情环境中企业声誉可能存在的变化,并对该变化即网络声誉破产的潜在风险做出预测和评估。
在上述实施例的基础上,本发明实施例提供的企业网络舆情潜在风险的评估系统中的第一处理模块41还用于,
获取与企业相关的网络评价报告,并识别网络评价报告中的情感信息关键词,基于情感信息关键词将网络评价报告分为网络正面评价和网络负面评价,其中网络评价报告可为媒体文件或非媒体文件,其中媒体文件包括语音、视频或者图片等,非媒体文件包括学校广播站、非正式论坛等。对于网络评价报告中的情感信息关键词可通过文字识别或语音识别来提取,例如网络评价报告为微博短文或网页评论等文字评价时,其中对企业的评价里出现喜欢或不喜欢等这样的情感信息词汇时,第一处理模块41可将喜欢或不喜欢等能够代表对企业态度的词汇通过文字识别提取出来,根据其态度将该评价分为正面评价或负面评价,以此来实现对网络评价报告中关于企业正负面评价的区分。
在上述实施例的基础上,本发明实施例提供的企业网络舆情潜在风险的评估系统中的第一处理模块41还用于,
获取网络评价报告的阅读量,基于阅读量分配网络评价报告的权重值,并根据每个网络正面评价及其对应的权重值得到正面网络舆情值,根据每个负面网络评价及其对应的权重值得到网络负面舆情值,其中网络评价报告的阅读量为网络评价报告的打开阅读次数或打开阅读时间等,该网络评价报告被打开阅读次数越多、打开阅读时间越长,其对应的网络评价报告的权重值就越大,相应的根据该网络评价报告得到的网络评价的权重值也就越大,其中如果网络评价是正面网络评价则正面网络舆情值的权重值就越大,如果网络评价是负面网络评价则负面网络舆情值的权重值就越大。
在上述各实施例的基础上,本发明实施例提供的企业网络舆情潜在风险的评估系统中的第二处理模块42具体用于,
获取企业当日前包括当日在内的连续N日的正面网络舆情值和负面网络舆情值,并计算网络声誉破产违约距离:
网络声誉破产违约距离=(N日正面网络舆情值之和-N日负面网络舆情值之和)/当日正面网络舆情值*(N日正面网络舆情值的方差)。即在得到企业网络舆情潜在风险评估当日以及当日前N-1天,总共N天的正面网络舆情值之和以及负面网络舆情值之和,第二处理模块42通过上述计算得出的值为网络声誉破产违约距离即预测到的企业声誉破产的日期距离预测当日的时间。
本发明实施例还提供了一种电子设备,图3为本发明实施例提供的电子设备的实体结构示意图,如图3所示,该电子设备包括:处理器(processor)510、通信接口(Communications Interface)520、存储器(memory)530和总线540,其中,处理器510,通信接口520,存储器530通过总线540完成相互间的通信。处理器510可以调用存储器530中的逻辑指令,以执行如下方法:基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;基于正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并基于网络声誉破产违约距离得到企业的网络声誉破产概率,根据网络声誉破产概率得到企业网络声誉潜在风险值。此外,上述的存储器530中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random AccessMemory)、磁碟或者光盘等各种可以存储程序代码的介质。
本发明实施例还提供了一种非暂态计算机可读存储介质,该非暂态计算机可读存储介质存储计算机指令,该计算机指令使计算机执行上述实施例所提供的企业网络舆情潜在风险的评估方法,例如包括:基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;基于正面网络舆情值和负面网络舆情值预测企业的网络声誉破产违约距离,并基于网络声誉破产违约距离得到企业的网络声誉破产概率,根据网络声誉破产概率得到企业网络声誉潜在风险值。
本发明电子设备以及非暂态计算机可读存储介质的实施例是用于执行上述各方法实施例的具体流程和详细内容,参照上述各方法实施例,此处不再叙述。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (10)

1.一种企业网络舆情潜在风险的评估方法,其特征在于,包括:
基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;
基于所述正面网络舆情值和所述负面网络舆情值预测企业的网络声誉破产违约距离,并基于所述网络声誉破产违约距离得到企业的网络声誉破产概率,根据所述网络声誉破产概率得到企业网络声誉潜在风险值。
2.根据权利要求1所述的方法,其特征在于,在所述基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值前还包括:
获取与企业相关的网络评价报告,并识别所述网络评价报告中的情感信息关键词,基于所述情感信息关键词将所述网络评价报告分为网络正面评价和网络负面评价。
3.根据权利要求2所述的方法,其特征在于,在所述基于所述情感信息关键词将所述网络评价文件分为网络正面评价和网络负面评价后还包括:
获取所述网络评价报告的阅读量,基于所述阅读量分配所述网络评价报告的权重值,并根据每个网络正面评价及其对应的权重值得到正面网络舆情值,根据每个负面网络评价及其对应的权重值得到网络负面舆情值。
4.根据权利要求1所述的方法,其特征在于,在所述基于所述正面网络舆情值和所述负面网络舆情值预测企业的网络声誉破产违约距离,具体包括:
获取企业当日前包括当日在内的连续N日的正面网络舆情值和负面网络舆情值,并计算网络声誉破产违约距离:
网络声誉破产违约距离=(N日正面网络舆情值之和-N日负面网络舆情值之和)/当日正面网络舆情值*(N日正面网络舆情值的方差)。
5.根据权利要求1所述的方法,其特征在于,所述基于所述网络声誉破产违约距离得到企业的网络声誉破产概率,具体包括:
基于连续多日网络声誉破产违约距离的正态分布状况得到网络声誉破产概率。
6.根据权利要求1所述的方法,其特征在于,在所述根据所述网络声誉破产概率得到企业网络声誉潜在风险值前,还包括:
对企业的历史网络声誉破产概率和企业置信值进行训练,得到企业网络声誉潜在风险值的风险系数。
7.根据权利要求6所述的方法,其特征在于,根据所述网络声誉破产概率得到企业网络声誉潜在风险值,具体包括:
Q=n*totle*Sqrt*Math.Sqrt(averlt*maxtimes*realweek/24/forward);
式中,Q为企业网络声誉潜在风险值,n为企业网络声誉潜在风险值的风险系数,totle为N日负面网络舆情值之和,Sqrt为N日负面网络舆情值的方差,Math.Sqrt()为开平方;averl为相邻两次负面网络舆情值超过N日平均值的间隔时间,maxtimes为连续M日负面网络舆情值超过N日平均值的次数,realweek为从实际抓到数据的那天起截止到当日的周数,forward=365。
8.根据权利要求1所述的方法,其特征在于,还包括:
计算企业的网络声誉隐含风险值:Y=MB+p*MD;
式中,Y为网络声誉隐含风险值,MB为(N-1)日负面网络舆情值的均值,MD为N日的负面网络舆情值的标准差,P=1.618。
9.根据权利要求1-8任一项所述的方法,其特征在于,在所述基于企业的网络负面评价得到负面网络舆情值之后还包括:
计算企业的破产临界值:P=α+β*(N日负面网络舆情值之和);
式中,P为企业的破产临界值,α=45.6,β=1.2。
10.一种企业网络舆情潜在风险的评估系统,其特征在于,包括:
第一处理模块,用于基于企业的网络正面评价得到正面网络舆情值,基于企业的网络负面评价得到负面网络舆情值;
第二处理模块,用于基于所述正面网络舆情值和所述负面网络舆情值预测企业的网络声誉破产违约距离,并基于所述网络声誉破产违约距离得到企业的网络声誉破产概率,根据所述网络声誉破产概率得到企业网络声誉潜在风险值。
CN201910277297.9A 2019-04-08 2019-04-08 一种企业网络舆情潜在风险的评估方法及系统 Pending CN109993448A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910277297.9A CN109993448A (zh) 2019-04-08 2019-04-08 一种企业网络舆情潜在风险的评估方法及系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910277297.9A CN109993448A (zh) 2019-04-08 2019-04-08 一种企业网络舆情潜在风险的评估方法及系统

Publications (1)

Publication Number Publication Date
CN109993448A true CN109993448A (zh) 2019-07-09

Family

ID=67132578

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910277297.9A Pending CN109993448A (zh) 2019-04-08 2019-04-08 一种企业网络舆情潜在风险的评估方法及系统

Country Status (1)

Country Link
CN (1) CN109993448A (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110634017A (zh) * 2019-08-23 2019-12-31 深圳市新系区块链技术有限公司 信息分类方法、装置及设备
CN111583012A (zh) * 2020-03-23 2020-08-25 北京航空航天大学 融合文本信息的信用债发债主体违约风险评估方法
CN111614663A (zh) * 2020-05-20 2020-09-01 支付宝(杭州)信息技术有限公司 一种业务风险确定方法、装置及电子设备
CN112365194A (zh) * 2020-12-01 2021-02-12 未鲲(上海)科技服务有限公司 企业数据处理方法、装置、设备及计算机存储介质
CN112711651A (zh) * 2020-12-30 2021-04-27 上海金仕达软件科技有限公司 一种舆情监测方法及系统
CN112862305A (zh) * 2021-02-03 2021-05-28 北京百度网讯科技有限公司 确定对象风险状态的方法、装置、设备和存储介质
CN113487148A (zh) * 2021-06-22 2021-10-08 中国联合网络通信集团有限公司 一种获取网络评价结果的方法及装置
CN113505221A (zh) * 2020-03-24 2021-10-15 国家计算机网络与信息安全管理中心 一种企业虚假宣传风险识别方法、设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108021651A (zh) * 2017-11-30 2018-05-11 中科金联(北京)科技有限公司 一种网络舆情风险评估方法及装置
KR20180087767A (ko) * 2017-01-25 2018-08-02 중앙대학교 산학협력단 링크드 데이터 기반의 안전정보 공유 장치 및 방법
CN109145216A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质
CN109165340A (zh) * 2018-07-19 2019-01-08 湖南富盟传媒有限公司 网络舆情监测系统

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR20180087767A (ko) * 2017-01-25 2018-08-02 중앙대학교 산학협력단 링크드 데이터 기반의 안전정보 공유 장치 및 방법
CN108021651A (zh) * 2017-11-30 2018-05-11 中科金联(北京)科技有限公司 一种网络舆情风险评估方法及装置
CN109165340A (zh) * 2018-07-19 2019-01-08 湖南富盟传媒有限公司 网络舆情监测系统
CN109145216A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110634017A (zh) * 2019-08-23 2019-12-31 深圳市新系区块链技术有限公司 信息分类方法、装置及设备
CN111583012A (zh) * 2020-03-23 2020-08-25 北京航空航天大学 融合文本信息的信用债发债主体违约风险评估方法
CN113505221A (zh) * 2020-03-24 2021-10-15 国家计算机网络与信息安全管理中心 一种企业虚假宣传风险识别方法、设备和存储介质
CN113505221B (zh) * 2020-03-24 2024-03-12 国家计算机网络与信息安全管理中心 一种企业虚假宣传风险识别方法、设备和存储介质
CN111614663A (zh) * 2020-05-20 2020-09-01 支付宝(杭州)信息技术有限公司 一种业务风险确定方法、装置及电子设备
CN112365194A (zh) * 2020-12-01 2021-02-12 未鲲(上海)科技服务有限公司 企业数据处理方法、装置、设备及计算机存储介质
CN112711651A (zh) * 2020-12-30 2021-04-27 上海金仕达软件科技有限公司 一种舆情监测方法及系统
CN112862305A (zh) * 2021-02-03 2021-05-28 北京百度网讯科技有限公司 确定对象风险状态的方法、装置、设备和存储介质
CN113487148A (zh) * 2021-06-22 2021-10-08 中国联合网络通信集团有限公司 一种获取网络评价结果的方法及装置
CN113487148B (zh) * 2021-06-22 2023-06-20 中国联合网络通信集团有限公司 一种获取网络评价结果的方法及装置

Similar Documents

Publication Publication Date Title
CN109993448A (zh) 一种企业网络舆情潜在风险的评估方法及系统
Vu et al. An experiment in integrating sentiment features for tech stock prediction in twitter
Halibas et al. Application of text classification and clustering of Twitter data for business analytics
CN111400499A (zh) 文档分类模型的训练方法、文档分类方法、装置及设备
Probierz et al. Rapid detection of fake news based on machine learning methods
Mandal et al. Overview of the FIRE 2017 IRLeD Track: Information Retrieval from Legal Documents.
CN104063399A (zh) 一种自动识别文本所承载的情感概率的方法及系统
Hassan et al. A supervised machine learning approach to detect fake online reviews
CN111179051A (zh) 金融目标客户确定方法、装置及电子设备
Agarwal et al. Sentiment Analysis in Stock Price Prediction: A Comparative Study of Algorithms
KR20210033294A (ko) 자동보고서생성장치 및 그 동작 방법
Reddy et al. Prediction of star ratings from online reviews
Tonja et al. Detection of Aggressive and Violent Incidents from Social Media in Spanish using Pre-trained Language Model.
CN111125561A (zh) 一种网络热度的展示方法及装置
Li et al. automatically detecting peer-to-peer lending intermediary risk—Top management team profile textual features perspective
CN107291686B (zh) 情感标识的辨识方法和情感标识的辨识系统
CN112132368A (zh) 信息处理方法以及装置、计算设备、存储介质
Prathyusha et al. Cyberbully detection using hybrid techniques
Clarizia et al. Sentiment analysis in social networks: A methodology based on the latent dirichlet allocation approach
Kaur et al. Multi-layered sentiment analytical model for product review mining
Hajare et al. A machine learning pipeline to examine political bias with congressional speeches
Qian et al. Satiindicator: Leveraging user reviews to evaluate user satisfaction of sourceforge projects
CN110443646B (zh) 产品竞争关系网络分析方法和系统
Noor et al. An efficient technique of predicting toxicity on music lyrics machine learning
Pataci et al. Stock price volatility prediction: A case study with AutoML

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190709

RJ01 Rejection of invention patent application after publication