CN111784492A - 舆情分析和财务预警方法、装置、电子设备和存储介质 - Google Patents

舆情分析和财务预警方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN111784492A
CN111784492A CN202010663122.4A CN202010663122A CN111784492A CN 111784492 A CN111784492 A CN 111784492A CN 202010663122 A CN202010663122 A CN 202010663122A CN 111784492 A CN111784492 A CN 111784492A
Authority
CN
China
Prior art keywords
public opinion
public
event
user
data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202010663122.4A
Other languages
English (en)
Inventor
汪雪松
徐靖雯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Iflytek Information Technology Co Ltd
Original Assignee
Iflytek Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Iflytek Information Technology Co Ltd filed Critical Iflytek Information Technology Co Ltd
Priority to CN202010663122.4A priority Critical patent/CN111784492A/zh
Publication of CN111784492A publication Critical patent/CN111784492A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q40/00Finance; Insurance; Tax strategies; Processing of corporate or income taxes
    • G06Q40/12Accounting
    • G06Q40/125Finance or payroll
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/335Filtering based on additional data, e.g. user or group profiles
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Business, Economics & Management (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Finance (AREA)
  • Data Mining & Analysis (AREA)
  • Accounting & Taxation (AREA)
  • General Engineering & Computer Science (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Economics (AREA)
  • Marketing (AREA)
  • Strategic Management (AREA)
  • Technology Law (AREA)
  • General Business, Economics & Management (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例提供一种舆情分析和财务预警方法、装置、电子设备和存储介质,其中舆情分析方法包括:采集待分析的对象的初始舆论数据;基于初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除初始舆论数据中的非自然舆论数据,得到自然舆论数据;基于自然舆论数据,对对象进行舆情分析。本发明实施例提供的方法、装置、电子设备和存储介质,通过初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除初始舆论数据中的非自然舆论数据,避免了刻意引导舆论风向导致舆情数据无法反映待分析的对象的真实情况的问题,基于由此得到的自然舆论数据进行舆情分析,能够保证舆情分析的客观性和准确性。

Description

舆情分析和财务预警方法、装置、电子设备和存储介质
技术领域
本发明涉及网络信息技术领域,尤其涉及一种舆情分析和财务预警方法、装置、电子设备和存储介质。
背景技术
企业财务危机预警作为企业管理的重要组成,目前主要通过财务指标建模实现。而财务指标自身的滞后性和可人为操纵的特性,严重影响了该类模型的可信度。
随着互联网技术的迅猛发展,企业相关的网络舆论数据能够快速反映网民对于企业财务相关事件的情感倾向,且网络舆论数据具有难以修改的特性。如何合理应用网络舆论数据,进行企业财务的舆情分析和财务预警,仍然是本领域技术人员亟待解决的问题。
发明内容
本发明实施例提供一种舆情分析和财务预警方法、装置、电子设备和存储介质,用以解决现有技术中财务预警方法存在滞后性和可人为操纵的缺陷。
第一方面,本发明实施例提供一种舆情分析方法,包括:
采集待分析的对象的初始舆论数据;
基于所述初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除所述初始舆论数据中的非自然舆论数据,得到自然舆论数据;
基于所述自然舆论数据,对所述对象进行舆情分析。
可选地,任一用户的舆论影响参数包括所述任一用户的舆论发布数量,和/或所述任一用户的舆论传播范围;
任一用户的舆论针对性参数包括所述任一用户针对所述对象的情感倾向一致性,和/或所述任一用户在舆情高涨日期的舆论参与程度。
可选地,所述任一用户在舆情高涨日期的舆论参与程度的获取方法,包括如下步骤:
基于所述初始舆论数据,统计所述任一用户在所述舆情高涨日期的舆论参与情况,以及所述任一用户在所有日期的舆论参与情况;
基于所述任一用户分别在所述舆情高涨日期和所有日期的舆论参与情况,确定所述舆论参与程度。
可选地,所述基于所述自然舆论数据,对所述对象进行舆情分析,具体包括:
基于所述自然舆论数据,确定若干个舆情事件的日期区间;
基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件性质和/或事件强度。
可选地,所述基于所述自然舆论数据,确定若干个舆情事件的日期区间,具体包括:
基于所述自然舆论数据,确定日常舆论发布数量,以及多个日期的舆论发布数量;
若任一日期内发生预设事件,则基于所述日常舆论发布数量、所述任一日期的舆论发布数量,以及预设数量比阈值,判断所述任一日期内是否发生舆情事件;
否则,基于所述日常舆论发布数量、所述任一日期的舆论发布数量,以及通用数量比阈值,判断所述任一日期内是否发生舆情事件;
所述预设数量比阈值小于所述通用数量比阈值。
可选地,所述基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件性质,具体包括:
基于所述自然舆情数据中任一舆情事件的日期区间内任一用户发布的所有舆论的情感倾向,确定所述任一用户的舆情性质,所述舆情性质为正向、负向、反转为负向和反转为正向中的一种;
基于每一用户的舆情性质,确定所述任一舆情事件的事件性质。
可选地,所述基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件强度,具体包括:
基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件基准强度;
基于所述任一舆情事件的事件基准强度,以及所述任一舆情事件的群体性质,确定所述任一舆情事件的事件强度;所述群体性质为群体性事件或个体性事件。
可选地,所述任一舆情事件的群体性质是基于所述任一舆情事件的日期区间,以及所述对象所属对象集合中其余各个对象的舆情事件的日期区间确定的。
第二方面,本发明实施例提供一种财务预警方法,包括:
基于如第一方面提供的舆情分析方法,对待分析的对象进行舆情分析,得到所述对象的舆情分析结果;
基于所述对象的舆情分析结果,对所述对象进行财务预警。
可选地,所述基于所述对象的舆情分析结果,对所述对象进行财务预警,具体包括:
基于所述对象的舆情分析结果、所述对象的关联对象的舆情分析结果,以及所述对象与所述关联对象之间的关系,对所述对象进行财务预警。
第三方面,本发明实施例提供一种舆情分析装置,包括:
舆论采集单元,用于采集待分析的对象的初始舆论数据;
舆论清洁单元,用于基于所述初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除所述初始舆论数据中的非自然舆论数据,得到自然舆论数据;
舆论分析单元,用于基于所述自然舆论数据,对所述对象进行舆情分析。
第四方面,本发明实施例提供一种财务预警装置,包括:
舆情分析单元,用于基于如第一方面提供的舆情分析方法,对待分析的对象进行舆情分析,得到所述对象的舆情分析结果;
财务预警单元,用于基于所述对象的舆情分析结果,对所述对象进行财务预警。
第五方面,本发明实施例提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如第一方面提供的舆情分析方法,或如第二方面提供的财务预警方法的步骤。
第六方面,本发明实施例提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如第一方面提供的舆情分析方法,或如第二方面提供的财务预警方法的步骤。
本发明实施例提供的舆情分析和财务预警方法、装置、电子设备和存储介质,通过初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除初始舆论数据中的非自然舆论数据,避免了刻意引导舆论风向导致舆情数据无法反映待分析的对象的真实情况的问题,基于由此得到的自然舆论数据进行舆情分析,能够保证舆情分析的客观性和准确性。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本发明实施例提供的一种舆情分析方法的流程示意图;
图2为本发明实施例提供的一种舆论参与程度的获取方法流程示意图;
图3为本发明实施例提供的一种基于自然舆论数据的舆情分析方法的流程示意图;
图4为本发明实施例提供的一种舆情事件的判断方法的流程示意图;
图5为本发明实施例提供的一种舆情事件的事件性质确定方法的流程示意图;
图6为本发明实施例提供的一种舆情事件的事件强度计算方法的流程示意图;
图7为本发明实施例提供的一种财务预警方法的流程示意图;
图8为本发明实施例提供的一种舆情分析装置的结构示意图;
图9为本发明实施例提供的一种财务预警装置的结构示意图;
图10为本发明实施例提供的一种电子设备的结构示意图。
具体实施方式
为使本发明实施例的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
企业相关的网络舆论数据反映了网民对于企业财务相关事件的情感倾向,且网络舆论数据具有难以修改的特性。合理应用网络舆论数据,对于进行企业财务的舆情分析和财务预警都具有重要意义。然而直接通过互联网抓取得到的舆论数据中,极有可能掺杂着企业的公关团队或者企业竞争对手的公关团队出于商业利益等考虑而发布的舆论,这些舆论通常故意曲解企业真实的财务情况,例如夸大或者掩盖企业存在的财务危机,从而引导舆论走向。这些舆论的存在,会直接影响企业财务的舆情分析和财务预警的客观性和准确性。对此,本发明实施例提供一种舆情分析方法,从而实现客观、准确的舆情分析。
图1为本发明实施例提供的一种舆情分析方法的流程示意图,如图1所示,该方法包括:
步骤110,采集待分析的对象的初始舆论数据。
此处,待分析的对象即需要进行舆情分析的对象,对象具体可以是企业,也可以是其他主体,例如事件主题、人物、产品等。初始舆论数据即针对待分析的对象进行网络舆论数据抓取得到的,具体可以通过搜索待分析的对象得到,或者通过网络爬虫抓取等。
需要说明的是,在特定领域进行舆情分析时,例如针对某个企业的财务情况进行舆情分析时,可以将对象设置为该企业,将初始舆论数据的采集来源设置为财经相关的网站,在通过网络爬虫采集到与该企业相关的舆论数据后,还可以进一步利用预先设定的财务类的词汇,如“经营危机”、“市值大跌”、“监管问询”、“业绩下滑”、“关联方侵占”等,滤除舆论数据中与财务无关的信息,由此得到初始舆论数据。
初始舆论数据可以包含不同用户针对待分析的对象发布舆论的文本,也可以包含舆论的发布用户、点赞用户、转发用户等,还可以包含舆论的发布时间、点赞时间、转发时间等,还可以包含舆论的情感倾向,本发明实施例不对此作具体限定。
步骤120,基于初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除初始舆论数据中的非自然舆论数据,得到自然舆论数据。
具体地,非自然舆论数据即用户出于特殊目的发布的用于刻意进行舆论引导的舆论数据,非自然舆论数据夸大或者掩盖了待分析的对象的真实情况。
考虑到通常非自然舆论数据的是由特定的若干个用户发布的,例如待分析的对象的公关团队、待分析的对象的竞争对手的公关团队等,可以基于初始舆论数据中各个用户发布舆论的特点,判断用户本身是否可能是非自然舆论数据的发布方,进而滤除非自然舆论数据的发布方发布的所有舆论,得到自然舆论数据。此处,自然舆论数据是指不具备刻意引导舆论目的,能够反映待分析的对象的真实情况的舆论数据。
此处,用于判断用户本身是否是非自然舆论数据的发布方的参数,包括用户的舆论影响参数、舆论质量参数以及舆论针对性参数:
其中,舆论影响参数用于衡量该用户发布的舆论的影响力,从而判断该用户发布的舆论本身是否存在引导舆论的能力。通常,舆论影响参数越大,则该用户发布的舆论所具备的舆论引导能力越强,该用户越可能承担非自然舆论数据的发布任务。舆论影响参数可以是初始舆论数据中该用户发布舆论的数量,也可以是该用户本身的粉丝人数,该用户发布舆论的阅读量、转发量、点赞量等。
舆论质量参数用于衡量该用户发布的舆论是否具备较高的专业水准,从而判断该用户发布的舆论本身是否为容易影响其他用户的舆论。通常用户发布舆论的专业水准越高,舆论引发关注并且引导舆论走向的概率越高。舆论质量参数可以是该用户发布舆论的文本中是否包含专业词汇,或者文本中专业词汇的应用比例等。
舆论针对性参数用于衡量该用户发布舆论对于待分析的对象的针对性,从而判断该用户发布的舆论是否是针对待分析的对象进行刻意舆论引导的。通常用户发布舆论的针对性越强,该用户是针对待分析的对象进行刻意舆论引导的概率越高。舆论针对性参数可以是该用户发布的舆论中对于待分析的对象的情感倾向是否恒定,也可以是该用户在待分析的对象发生舆情事件期间的发布的舆论数量,还可以是该用户在待分析的对象发生舆情事件期间发布的舆论数量与该用户日常发布舆论数量的比值等。
结合用户的舆论影响参数、舆论质量参数以及舆论针对性参数,可以衡量用户是否具备作为非自然舆论数据发布方的资质,以及用户的行为是否满足非自然舆论数据发布方的条件,从而判断用户本身是否为非自然舆论数据发布方。在判断结束后,即可删除初始舆论数据中非自然舆论数据发布方发布的所有舆论数据,从而得到能够真实放映待分析的对象在真实情况下的自然舆论数据。
步骤130,基于自然舆论数据,对对象进行舆情分析。
具体地,在得到自然舆论数据后,即可通过对自然舆论数据中所有舆论数据的情感倾向进行分析,从而得到该对象的舆情分析结果。例如,针对某个企业的财务情况进行舆情分析时,可以基于与该企业的财务情况相关的自然舆论数据进行舆情分析,从而得到可以表征该企业是否发生了财务相关的舆情事件,以及舆情事件的发生时期、事件性质和强度等信息的舆情分析结果。
本发明实施例提供的方法,通过初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除初始舆论数据中的非自然舆论数据,避免了刻意引导舆论风向导致舆情数据无法反映待分析的对象的真实情况的问题,基于由此得到的自然舆论数据进行舆情分析,能够保证舆情分析的客观性和准确性。
基于上述实施例,任一用户的舆论影响参数包括该用户的舆论发布数量,和/或该用户的舆论传播范围。
具体地,任一用户的舆论发布数量是指初始舆论数据中由该用户发布的舆论的数量,舆论发布数量可以反映该用户是否积极主动地发布观点,从而体现用户的活跃度,通常非自然舆论数据的发布方均是活跃度较高的用户,可以从发布初始舆论数据的所有用户中筛选中舆论发布数量最高的预设数量个用户,作为可能发布非自然舆论数据的用户。
任一用户的舆论传播范围可以反映该用户对于舆论风向的影响力,一般非自然舆论数据的发布涉通常是对于舆论风向的移相量较高的用户。舆论传播范围可以通过用户的粉丝人数、粉丝规模,以及用户发布舆论的阅读量、转发量、点赞量等体现。
可以从发布初始舆论数据的所有用户中筛选中舆论传播范围最大的预设数量个用户,作为可能发布非自然舆论数据的用户,或者在基于舆论发布数量选取到的可能发布非自然舆论数据的用户的基础上,判断各个用户的舆论传播范围是否小于预先设定的传播范围阈值,并从可能发布非自然舆论数据的用户中删除舆论传播范围小于传播范围阈值的用户。
例如,舆论发布数量Activation(用户u)可以表示为如下公式:
Activation(用户u)=舆论文本的发布个数
舆论传播范围可以表示为如下公式:
influence(用户u)=α×粉丝人数+β×被点赞次数
式中,influence(用户u)即用户u的舆论传播范围,粉丝人数可以通过抓取用户u在初始舆论数据同时段的用户信息得到,被点赞次数即初始舆论数据中用户u发布的所有舆论的被点赞的次数的总和。α和β分别为预先设定的粉丝人数和被点赞次数的权重,具体权重设定方法本案不做限定。
进一步地,假设初始舆论数据中,每一条舆论均是通过如下形式保存的:
{用户ID,发布时间,舆论文本,是否点赞,点赞源用户ID,情感倾向}
假设待分析的对象为企业C,用户A于2020年7月2日12:00发布了文字“良心企业C市值大涨,真心赞!”用于表达对于企业C的积极情绪,之后用户B于2020年7月2日13:00为其“点赞”。则对用户A的行为进行存储时,“用户ID”为用户A,“发布时间”为2020年7月2日12:00,“舆论文本”为“良心企业C市值大涨,真心赞!”,“是否点赞”为FALSE,“点赞源用户ID”为NULL,情感倾向为正向。对用户B的行为进行存储时,“用户ID”为用户B,发布时间为2020年7月2日13:00,“舆论文本”为“良心企业C市值大涨,真心赞!”,“是否点赞”为TRUE,“点赞源用户ID”为用户A,情感倾向为正向。
基于上述格式,统计用户u的舆论发布数量时,可以将初始舆论数据中“用户ID”为u并且“是否点赞”为FALSE的全部数据进行计数;统计用户u的被点赞次数时,可以将初始舆论数据中“是否点赞”为TRUE且“点赞源用户ID”为u的全部数据进行计数。
本发明实施例提供的方法,从舆论影响力的角度考虑,对初始舆论数据的所有用户进行了筛选,为非自然舆论数据的滤除提供了条件。
基于上述任一实施例,任一用户的舆论质量参数是基于初始舆论数据中该用户发布的所有舆论文本中专业词汇的占比确定的。
具体地,针对任一用户,可以得到初始舆论数据中该用户发布的所有舆论文本,对所有舆论文本进行分词,即可得到该用户发布的舆论文本的词汇总数,并根据分词结果和预先设定的专业词汇列表进行匹配,从而确定舆论文本中专业词汇数量,基于专业词汇数量和词汇总数,即可得到专业词汇的占比,具体可以表示为如下公式:
Figure BDA0002579353560000101
式中,professional(用户u)即用户u发布的所有舆论文本中专业词汇的占比,wordnum(u)为用户u发布的所有舆论文本的词汇总数,wordnum(u,专业词汇)为用户u发布的所有舆论文本中的专业词汇数量。需要说明的是,当进行财务舆情分析时,此处的专业词汇具体可以是财务词汇。
可以通过该用户发布的所有舆论文本中专业词汇的占比的高低,判断该用户发布的舆论的质量高低,进而确定该用户的舆论质量参数。如果任一用户的舆论质量参数高于预先设定的质量参数阈值,则确定该用户具有较高专业水准,可以将具有较高专业水准的用户作为可能发布非自然舆论数据的用户。
基于上述任一实施例,任一用户的舆论针对性参数包括该用户针对对象的情感倾向一致性,和/或该用户在舆情高涨日期的舆论参与程度。
具体地,任一用户针对对象的情感倾向一致性用于反映该用户对于对象的情感倾向是否是始终一致的,具体可以是始终正向、始终负向、不恒定或者空。可以获取初始舆论数据中任一用户发布的所有舆论,并分析所有舆论的情感倾向,若所有舆论的情感倾向均是正向,或者均为正向和中性,则确定该用户的情感倾向一致性为始终正向;若所有舆论的情感倾向均是负向,或者均为负向和中性,则确定该用户的情感倾向一致性为始终负向;若所有舆论的情感倾向中既包含正向又包含负向,则确定该用户的情感倾向一致性为不恒定。特别地,若所有舆论的情感倾向均为中性,说明该用户对于对象没有明显的情感倾向,可以将该用户对于对象的情感倾向一致性设置为空,表示未检测到能够说明该用户对于对象的情感倾向是否始终一致的数据。
考虑到发布非自然舆论数据的用户本身并不客观,通常具备明确的立场,例如对象的公关团队始终发布正向舆论,而对象的竞争对手的公关团队则始终发布负向舆论,可以通过用户针对对象的情感倾向一致性判断用户本身是否可能是非自然舆论数据的发布方。若用户针对于对象的情感倾向一致性为始终正向或始终负向,则说明该用户可能是非自然舆论数据的发布方。
需要说明的是,此处情感倾向一致性判断中应用到的用户发布的所有舆论的情感倾向,情感倾向可以沿用通用的情感倾向类别,例如正向、负向和中性。情感倾向可以根据通用的情感倾向分析方法得到。
任一用户在舆情高涨日期的舆论参与程度可以是该用户在舆情高涨日期发布的舆论数量,还可以是该用户在舆情高涨日期发布的舆论数量与该用户日常发布舆论数量的比值等。
此处,舆情高涨日期是指产生大量针对该对象的舆论数据的日期,舆情高涨日期可以通过比较每个日期内产生的针对该对象的舆论数量以及日常产生的针对该对象的舆论数量确定,此处的日期可以是按天划分的,也可以是按照其他时间单位划分的,本发明实施例对此不作具体限定。
例如假设任一日期date内产生的对象C的舆论数据量为voice(对象C,日期date),日常产生的对象C的舆论数据量为medvoice(对象C),若该段时期的舆论数据量满足如下公式,则将该段时期记为舆情高涨日期:
Figure BDA0002579353560000121
式中,medvoice(对象C)可以是通过统计各个日期内产生的对象C的舆论数据量得到的,例如medvoice(对象C)可以是各个日期内产生的对象C的舆论数据量的中位数。threshold舆情高涨为预先设定的大于1的阈值。
其中,voice(对象C,日期date)=舆论发布数+点赞数,即日期date内产生的对象C的舆论数据量可以表示为该日期内所有用户发布的舆论总量与点赞的舆论总量之和。
基于上述任一实施例,图2为本发明实施例提供的一种舆论参与程度的获取方法流程示意图,如图2所示,任一用户在舆情高涨日期的舆论参与程度的获取方法,包括如下步骤:
步骤210,基于初始舆论数据,统计该用户在舆情高涨日期的舆论参与情况,以及该用户在所有日期的舆论参与情况;
步骤220,基于该用户分别在舆情高涨日期和所有日期的舆论参与情况,确定舆论参与程度。
此处,舆论参与情况具体可以是用户的舆论发布数量,也可以是用户点赞、转发其他用户的舆论数量。例如,可以统计初始舆论数据中在任一日期内用户发布的所有舆论的总数,以及用户点赞的所有舆论的总数,作为用户在该日期的舆论参与情况,具体可以体现为如下公式:
voice(用户u,日期date)=舆论发布数+点赞数
进一步地,在统计用户u的舆论发布数时,可以将初始舆论数据中“发表时间”在日期date内、“用户ID”为u且“是否点赞”为FALSE的全部数据进行计数;在统计用户u的点赞数时,可以将“发表时间”在日期date内、“用户ID”为u且“是否点赞”为TRUE的全部数据进行计数。
随即,可以基于舆情高涨日期,分别得到用户在舆情高涨日期和所有日期的舆论参与情况,通过比较两种不同的舆论参与情况,得到用户在舆情高涨日期的舆论参与程度。例如,可以在得到用户在所有日期的舆论参与情况后,从中选取中位数作为用户日常的舆论参与情况,并将用户在舆情高涨日期的舆论参与情况和日常的舆论参与情况两者的比值,作为用户在舆情高涨日期的舆论参与程度。
在此基础上,可以通过将用户在舆情高涨日期的舆论参与程度,与对象在舆情高涨日期的舆论涨幅进行比较,从而判断当对象引发舆论关注时,用户是否尤其活跃地进行舆论引导,具体可以体现为如下公式:
Figure BDA0002579353560000141
式中,voice(用户u,日期date)为用户u在舆情高涨日期的舆论参与情况,medvoice(用户u)为用户u日常的舆论参与情况,两者的比值即用户u在舆情高涨日期的舆论参与程度。γ为预先设定的系数,且γ>1。
若用户u在舆情高涨日期的舆论参与程度满足上述公式,则可以确定用户u在舆情高涨日期的舆论参与程度极高,用户在对象引发舆论关注时,其行为极可能是在刻意引导舆论,用户u对于对象具有强针对性,用户可能是非自然舆论数据的发布方。
基于上述任一实施例,步骤120中,基于初始舆论数据中任一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,可以分别从三个方面判断该用户是否可能是非自然舆论数据的发布方,如果三个方面的条件均满足,则可以确定该用户是非自然舆论数据的发布方,可以将从初始舆论数据中与该用户关联的所有数据作为非自然舆论数据全部删除。
基于上述任一实施例,图3为本发明实施例提供的一种基于自然舆论数据的舆情分析方法的流程示意图,如图3所示,步骤130具体包括:
步骤131,基于自然舆论数据,确定若干个舆情事件的日期区间。
具体地,自然舆论数据中可以包含多个日期发生的舆论数据,可以通过统计各个日期发生的舆论数据量,判断各个日期是否发生了舆情事件,进而确定若干个舆情事件的日期区间。此处,日期区间包含若干个连续的日期,例如6月5日至6月9日,任一舆情事件的日期区间用于表示该舆情事件发生的时期。
步骤132,基于自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定该舆情事件的事件性质和/或事件强度。
具体地,针对任一舆情事件的日期区间,可以从自然舆情数据中抽取该日期区间内发生的所有舆论,并分析所有舆论的情感倾向,由此确定该舆情事件的事件性质。例如,任一舆情事件的日期区间内发生的大多数舆论的情感倾向均是负向,则可以确定该舆情事件的事件性质为负向,可能会对对象产生负面影响。
此外,还可以基于从自然舆情数据中抽取该日期区间发生的所有舆论,分析所有舆论的情感倾向,由此确定该舆情事件的事件强度。例如,任一舆情事件的日期区间内产生数量极大的情感倾向为正向的舆论,则该舆情事件的事件强度较高。
通常在判断是否发生舆情事件时,通常将每个日期内发生舆论数据的数据量作为判断标准。然而存在一些针对待分析的对象的特殊事件,这些特殊事件发生时期的产生的舆论数据量未必能够满足舆情事件发生的判断条件,但是此时产生的舆论数据对应对象的舆情分析仍然十分重要。对此,基于上述任一实施例,图4为本发明实施例提供的一种舆情事件的判断方法的流程示意图,如图4所示,步骤131具体包括:
步骤1311,基于自然舆论数据,确定日常舆论发布数量,以及多个日期的舆论发布数量。
具体地,可以统计得到自然舆论数据中每个日期内的舆论发布数量,并且在此基础上,通过求取中位数等方法得到日常舆论发布数量。
步骤1312,若任一日期内发生预设事件,则基于日常舆论发布数量、该日期的舆论发布数量,以及预设数量比阈值,判断该日期内是否发生舆情事件;
步骤1313,否则基于日常舆论发布数量、该日期的舆论发布数量,以及通用数量比阈值,判断该日期内是否发生舆情事件;
预设数量比阈值小于通用数量比阈值。
具体地,在步骤1311的基础上,可以首先判断任一日期内是否发生了预设事件,此处的预设事件即预先设定好的可能对待分析对象产生较大影响的事件。
例如针对某个企业的财务情况进行舆情分析时,预设事件可以是企业发布财务报表、企业被证监会点名等,上述预设事件可以通过监测相关网站的信息发布捕捉得到。对于企业而言,如果发布的财务报表远远偏离了大众预期,必然会造成舆论数量的大幅上涨,形成舆情事件。然而即便发布的财务报表与预期相符合,舆论数据量没有大幅上涨,但是这段日期区间的舆论大多是针对于财务报表的,相对于其余时期的舆论,这段日期区间的舆论明显具备更高的质量,更能够反映企业的财务情况。又例如,如果企业被证监会点名,则必然是企业发生了性质重大的财务事件,即便没有引发巨大的舆论反响,此段日期区间的舆论也显然相比其余日期具备更高的质量,更能够反映企业的财务情况。因此可以适当降低预设事件发生的日期区间内的各个日期用于判断是否发生舆情事件的舆论发布数量的阈值。
在判断任一日期内是否发生舆情事件时,可以首先判断该时期内是否发生预设事件,即该日期是否在预设事件发生的日期区间内。如果发生了预设事件,则可以适当降低舆情事件发生的判断条件,基于日常舆论发布数量、该日期的舆论发布数量确定该日期的舆论发布数量的涨幅,并将涨幅与预设数量比阈值进行比较,进而判断该日期内是否发生舆情事件,具体判断公式如下:
Figure BDA0002579353560000161
式中,threshold舆情增多表示预设数量比阈值。
此外,判断任一日期内是否发生预设事件具体可以通过判断该日期是否在预设事件发生的日期区间内。例如某个企业在日期DATE发生了预设事件,则可以将从DATE-threshold特殊日起到DATE+threshold特殊日止的这一段日期区间,记为预设事件发生的日期区间。此处,threshold特殊日为预先设定的预设日期范围阈值。
如果没有发生预设事件,则可以基于日常舆论发布数量、该日期的舆论发布数量确定该日期的舆论发布数量的涨幅,并将涨幅与通用数量比阈值进行比较,进而判断该日期内是否发生舆情事件,具体判断公式如下:
Figure BDA0002579353560000171
式中,threshold舆情高涨表示通用数量比阈值,threshold舆情增多<threshold舆情高涨
若上述判断公式得到满足,则确定该日期内发生了舆情事件,否则,确定该日期内未发生舆情事件。
在此基础上,若干个发生了舆情事件的连续日期,构成一次舆情事件的日期区间。
本发明实施例提供的方法,通过为预设事件的发生日期额外设置判断条件,使得本身可能对对象产生较大影响的事件发生日期内的舆论数据不会被遗漏,从而提高舆情分析的准确性和可靠性。
通常对于舆情事件的事件性质的界定,是直接分为“正向”和“负向”两种。但实际上舆情事件的发展过程中,经常出现反转、辟谣等情况,由此引发舆情转向。如果仅从“正向”和“负向”两个角度进行事件性质的界定,必然会导致大量信息的丢失。
为了提高舆情事件的事件性质界定的准确性,基于上述任一实施例,图5为本发明实施例提供的一种舆情事件的事件性质确定方法的流程示意图,如图5所示,步骤132中,基于自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定该舆情事件的事件性质,具体包括:
步骤1321-1,基于自然舆情数据中任一舆情事件的日期区间内任一用户发布的所有舆论的情感倾向,确定该用户的舆情性质,舆情性质为正向、负向、反转为负向和反转为正向中的一种。
具体地,针对任一舆情事件,可以统计自然舆情数据中该舆情事件的日期区间内任一用户发布的所有舆论的情感倾向,并按照该用户发布舆论的时间顺序进行排序,从而确定该用户针对该舆情事件的舆情性质。
此处,舆情性质可以反映出该用户对于该舆情事件的情感倾向,以及情感倾向的变化过程,舆情性质具体可以是正向、负向、反转为负向和反转为正向中的一种,其中正向即表示该用户对于该舆情事件发布的所有舆论的情感倾向均为正向,或者均为正向和中性;负向即表示该用户对于该舆情事件发布的所有舆论的情感倾向均为负向,或者均为负向和中性;反转为负向表示该用户对于该舆情事件发布的所有舆论中,前期的情感倾向为正向,后期的情感倾向为负向;反转为正向表示该用户对于该舆情事件发布的所有舆论中,前期的情感倾向为负向,后期的情感倾向为正向。具体可以体现为如下公式:
Figure BDA0002579353560000181
式中,opinion(u|C,zone)即用户u在日期区间zone内对于对象C的舆情性质。式中的情绪即用户u发布的舆论的情感倾向,需要说明的是,在基于上述公式确定用户对于该舆情事件的舆情性质时,用户u发布的所有情感倾向为中性的舆论均可以忽略不计。
需要说明的是,在针对任一用户对任一舆情事件的舆情性质进行分析的过程中,如果出现类似于“正向→负向→正向”或者更复杂的变化,则认为是该用户在此舆情事件的日期区间内发布的是无价值舆论,忽略该用户在此舆情事件的日期区间内发布的全部舆情数据。
步骤1321-2,基于每一用户的舆情性质,确定该舆情事件的事件性质。
具体地,在得到每一用户针对任一舆情事件的舆情性质后,即可确定该舆情事件的事件性质,例如可以将用户人数最多的舆情性质作为该舆情事件的舆情性质。
本发明实施例提供的方法,通过分析每个用户在舆情事件过程中的情感倾向的变化,从而准确反映舆情事件的事件性质。
基于上述任一实施例,图6为本发明实施例提供的一种舆情事件的事件强度计算方法的流程示意图,如图6所示,步骤132中,基于自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定该舆情事件的事件强度,具体包括:
步骤1332-1,基于自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定该舆情事件的事件基准强度。
具体地,舆情事件的事件基准强度用于表征针对于舆情事件自身的事件强度,事件基准强度可以通过与舆情事件相关的所有舆论的感情倾向确定。例如事件基准强度可以表示为所有情感倾向为正向的舆论数据量与所有情感倾向为负向的舆论数据量的差值。
进一步地,舆情事件的事件基准强度SBase还可以结合舆情事件的事件性质以及舆情事件的日期区间内发布的各种情感倾向的舆论数据量确定,具体可以表示为如下公式:
Figure BDA0002579353560000191
式中,S正向、S反转为正向、S负向和S反转为负向分别表示对该舆情事件的情感倾向为正向、反转为正向、负向和反转为负向的用户数量。
步骤1332-2,基于该舆情事件的事件基准强度,以及该舆情事件的群体性质,确定该舆情事件的事件强度;群体性质为群体性事件或个体性事件。
此处,舆情事件的群体性质用于表征该舆情事件是对应于待分析对象的个体性事件,还是属于待分析对象所处领域、行业或者地区的群体性事件。针对于群体性事件,可以在其事件基准强度的基础上进行衰减,从而得到衰减后的强度作为该舆情事件的事件强度;针对于个体性事件,可以直接将事件基准强度作为该舆情事件的事件强度。
例如,群体性事件的事件强度Strength,可以通过如下公式计算得到:
Strength=coef群体性事件的衰减×SBase
式中,SBase为该舆情事件的事件基准强度,coef群体性事件的衰减为预先设定的衰减系数。
本发明实施例提供的方法,基于舆情事件的群体性质计算舆情事件的事件强度,从而提高舆情事件强度分析的准确性和可靠性。
此外,在计算舆情事件的事件强度时,处理考虑舆情事件的群体性质,还可以引入时间衰减因素,参考舆情事件的发生时间与当前时间之间的距离衡量舆情事件的事件强度,通常时间距离越久远,事件强度相对越弱。
基于上述任一实施例,任一舆情事件的群体性质是基于该舆情事件的日期区间,以及对象所属对象集合中其余各个对象的舆情事件的日期区间确定的。
具体地,可以预先设置对象集合,对象集合中可以包含多个相互之间存在群体性特征的对象,例如可以是属于同一领域、同一行业或者同一地域的对象,也可以是在产业链上具有相互关联性的对象。在待分析的对象所属对象集合达到一定规模、能够反映群体性特征的情况下,例如对象集合中包含的对象个数超过预先设定的对象数量阈值,在针对待分析的对象,判断其舆情事件的事件性质时,可以预先确定该舆情事件的日期区间,以及待分析的对象所处的对象集合中其余各个对象的舆情事件的日期区间,判断待分析的对象的舆情事件的日期区间和其余各个对象的舆情事件的日期区间之间是否存在重合,从而确定待分析的对象的舆情事件的事件性质。
例如,在待分析的对象C所属的对象集合中的各个对象均属于同一行业或同一地区,且对象集合中的对象数量超过预设的对象数量阈值的情况下,假设待分析的对象C的舆情事件的日期区间为zone,对象C所属对象集合中的每个对象ci,均存在一个日期区间为zonei的舆情事件,且zonei与zone高度重合,则可以确定待分析的对象C的舆情事件为群体性事件;若待分析的对象C所属的对象集合不满足上述条件,则确定待分析的对象C的舆情事件为个体性事件。
其中,zonei与zone是否高度重合,可以通过如下公式判断得到:
Figure BDA0002579353560000211
式中,|zonei∩zone|和|zonei∪zone|分别为zonei与zone的交集和并集,此两者的比值即zonei与zone的重合度,threshold日期范围重合度为预先设定的日期重合度阈值;若zonei与zone满足上式,即两者的重合度大于等于日期重合度阈值,则确定两者高度重合。
进一步地,以两个日期区间分别为“2020-03-15~2020-03-19”与“2020-03-14~2020-03-17”为例,对两个日期区间分别求交集和并集,得到交集“2020-03-15~2020-03-17”,并集“2020-03-14~2020-03-19”。
基于上述任一实施例,图7为本发明实施例提供的一种财务预警方法的流程示意图,如图7所示,财务预警方法包括:
步骤710,基于舆情分析方法,对待分析的对象进行舆情分析,得到对象的舆情分析结果。
具体地,舆情分析方法可以具体应用在对于企业的财务情况进行舆情分析,此时待分析的对象为企业,初始舆论数据即与待分析的企业财务相关的舆论数据。由此进行舆情分析得到的分析结果,具体可以是企业财务相关的舆情事件的日期区间、事件性质和事件强度等。
步骤720,基于对象的舆情分析结果,对对象进行财务预警。
具体地,在得到舆情分析结果后,可以直接应用舆情分析结果进行财务预警,也可以将舆情分析结果与通常用于财务预警的企业信息相结合进行财务预警。此处的企业信息可以进一步划分为财务指标和非财务指标,财务指标具体可以是“资产负债率”、“主营业务利润率”、“销售增长率”等,非财务指标具体可以是“客户满意度”、“高级管理层离职率”等。
在进行财务预警时,可以将舆情分析结果,或者舆情分析结果和企业信息输入到预先训练好的用于财务预警的神经网络模型中,由神经网络模型输出财务预警结果。此处,神经网络模型可以是基于支持向量机(support vector machines,SVM)或逻辑回归等机器学习算法构建的。财务预警结果可以是已发生财务危机或者未发生财务危机,还可以是已发生财务危机的严重程度。
进一步地,假设对象C的舆情分析结果可以记作:
Figure BDA0002579353560000221
等价可记作:
*(typei,zonei,strengthi)+
其中,任一次舆情事件,此处为重大财务事件,type代表事件性质、zone代表日期范围、strength代表事件强度。N为舆情分析结果中包含的舆情事件总数。
本发明实施例提供的方法,通过舆情分析结果进行财务预警,保证了财务预警的可靠性和时效性。
在进行财务预警时,不仅待分析对象的财务情况会直接影响对象的财务预警结果,待分析对象相关联的其余对象的财务情况也会对待分析对象构成影响。因此,基于上述任一实施例,步骤720具体包括:
基于对象的舆情分析结果、对象的关联对象的舆情分析结果,以及对象与关联对象之间的关系,对对象进行财务预警。
此处,待分析对象的关联对象即与待分析对象存在密切联系的对象,对于任一企业而言,该企业供应链上下游的企业,与该企业为同一实际控制人的企业,与该企业之间存在竞争关系的企业,均可以作为该企业的关系对象。
对象与关联对象之间的关系可以表示为正向关系和负向关系两种,例如任一企业与该企业的供应链上下游的企业,与该企业为同一实际控制人的企业之间的关系均为正向关系,该企业与其竞争对手企业之间的关系为负向关系。正向关系的关联对象的舆情分析结果对于待分析的对象的财务预警起到正向影响,负向关系的关联对象的舆情分析结果对于待分析的对象的财务预警起到负向影响。
例如,可以预先对负向关系的关联对象的舆情分析结果取反,并基于待分析的对象的舆情分析结果、正向关系的关联对象的舆论分析结果,以及取反后的负向关系的关联对象的舆情分析结果,对待分析的对象进行财务预警。进一步地,假设待分析对象为企业C,企业C及其关联对象中的任一企业记为当前企业Ci,企业C与当前企业Ci之间的关系companyflagi可以表示为:
Figure BDA0002579353560000231
由此可以得到在基于关联对象Ci的舆情分析结果进行财务预警之前,需要对关联对象Ci的舆情分析结果执行的操作newtypei
Figure BDA0002579353560000232
此处对typei取负值,可以用于表示取反,例如将“负向→正向”取反得到“正向→负向”。
本发明实施例提供的方法,结合待分析的对象的关联对象进行财务预警,能够进一步提高财务预警的准确性。
基于上述任一实施例,一种财务预警方法,包括如下步骤:
首先,确定需要进行财务预警的企业C,通过网络爬虫抓取企业C的财务相关的初始舆论数据。此处的初始舆论数据中包含的每条舆论均体现为如下格式:
{用户ID,发布时间,舆论文本,是否点赞,点赞源用户ID,情感倾向}
其次,基于初始舆论数据中各个用户发布舆论的特点,判断用户本身是否可能是非自然舆论数据的发布方,进而滤除非自然舆论数据的发布方发布的所有舆论,得到自然舆论数据。
接着,基于自然舆论数据,统计针对企业C的财务相关的日常舆论发布数量,以及多个日期的舆论发布数量。根据预先统计的企业C发生预设事件即重大财务事件的日期,分别判断各个日期内是否发生了预设事件,并根据日期内是否发生了预设事件,适用性选择预设数量比阈值或通用数量比阈值判断日期内是否发生舆情事件,从而确定企业C的舆情事件的日期区间。
在此基础上,针对各个舆情事件,分别基于自然舆情数据中各个舆情事件的日期区间内各个用户发布的所有舆论的情感倾向,确定各个用户针对各个舆情事件的舆情性质,进而得到能够反映舆情变化的舆情事件的事件性质,此处的事件性质可以是正向、负向、反转为负向和反转为正向中的一种。
接着,基于自然舆情数据中各个舆情事件的日期区间内发布的所有舆论的情感倾向,计算各个舆情事件的事件基准强度。并在此基础上,结合各个舆情事件的群体性质,确定各个舆情事件的事件强度。
此外,针对与企业C之间存在密切关联的其他企业,执行相同的步骤,得到与企业C之间存在密切关联的其他企业财务相关的舆情事件,以及舆情事件的事件性质和事件强度。
最后,结合企业C财务相关的舆情事件及其事件性质和事件强度,与企业C之间存在密切关联的其他企业财务相关的舆情事件及其的事件性质和事件强度,以及企业C与其他企业之间的关系,对企业C进行财务预警。
基于上述任一实施例,图8为本发明实施例提供的一种舆情分析装置的结构示意图,如图8所示,舆情分析装置包括舆论采集单元810、舆论清洁单元820和舆论分析单元830;
其中,舆论采集单元810用于采集待分析的对象的初始舆论数据;
舆论清洁单元820用于基于所述初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除所述初始舆论数据中的非自然舆论数据,得到自然舆论数据;
舆论分析单元830用于基于所述自然舆论数据,对所述对象进行舆情分析。
本发明实施例提供的装置,通过初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除初始舆论数据中的非自然舆论数据,避免了刻意引导舆论风向导致舆情数据无法反映待分析的对象的真实情况的问题,基于由此得到的自然舆论数据进行舆情分析,能够保证舆情分析的客观性和准确性。
基于上述任一实施例,任一用户的舆论影响参数包括所述任一用户的舆论发布数量,和/或所述任一用户的舆论传播范围;
任一用户的舆论针对性参数包括所述任一用户针对所述对象的情感倾向一致性,和/或所述任一用户在舆情高涨日期的舆论参与程度。
基于上述任一实施例,该装置还包括舆论参与程度获取单元,论参与程度获取单元用于:
基于所述初始舆论数据,统计所述任一用户在所述舆情高涨日期的舆论参与情况,以及所述任一用户在所有日期的舆论参与情况;
基于所述任一用户分别在所述舆情高涨日期和所有日期的舆论参与情况,确定所述舆论参与程度。
基于上述任一实施例,舆论分析单元830包括:
事件确定子单元,用于基于所述自然舆论数据,确定若干个舆情事件的日期区间;
事件分析子单元,用于基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件性质和/或事件强度。
基于上述任一实施例,事件确定子单元具体用于:
基于所述自然舆论数据,确定日常舆论发布数量,以及多个日期的舆论发布数量;
若任一日期内发生预设事件,则基于所述日常舆论发布数量、所述任一日期的舆论发布数量,以及预设数量比阈值,判断所述任一日期内是否发生舆情事件;
否则,基于所述日常舆论发布数量、所述任一日期的舆论发布数量,以及通用数量比阈值,判断所述任一日期内是否发生舆情事件;
所述预设数量比阈值小于所述通用数量比阈值。
基于上述任一实施例,事件分析子单元具体用于:
基于所述自然舆情数据中任一舆情事件的日期区间内任一用户发布的所有舆论的情感倾向,确定所述任一用户的舆情性质,所述舆情性质为正向、负向、反转为负向和反转为正向中的一种;
基于每一用户的舆情性质,确定所述任一舆情事件的事件性质。
基于上述任一实施例,事件分析子单元具体用于:
基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件基准强度;
基于所述任一舆情事件的事件基准强度,以及所述任一舆情事件的群体性质,确定所述任一舆情事件的事件强度;所述群体性质为群体性事件或个体性事件。
基于上述任一实施例,所述任一舆情事件的群体性质是基于所述任一舆情事件的日期区间,以及所述对象所属对象集合中其余各个对象的舆情事件的日期区间确定的。
基于上述任一实施例,图9为本发明实施例提供的一种财务预警装置的结构示意图,如图9所示,财务预警装置包括舆情分析单元910和财务预警单元920;
其中,舆情分析单元910用于基于舆情分析方法,对待分析的对象进行舆情分析,得到所述对象的舆情分析结果;
财务预警单元920用于基于所述对象的舆情分析结果,对所述对象进行财务预警。
本发明实施例提供的装置,通过舆情分析结果进行财务预警,保证了财务预警的可靠性和时效性。
基于上述任一实施例,财务预警单元920具体用于:
基于所述对象的舆情分析结果、所述对象的关联对象的舆情分析结果,以及所述对象与所述关联对象之间的关系,对所述对象进行财务预警。
图10示例了一种电子设备的实体结构示意图,如图10所示,该电子设备可以包括:处理器(processor)1010、通信接口(Communications Interface)1020、存储器(memory)1030和通信总线1040,其中,处理器1010,通信接口1020,存储器1030通过通信总线1040完成相互间的通信。处理器1010可以调用存储器1030中的逻辑指令,以执行舆情分析方法,该方法包括:采集待分析的对象的初始舆论数据;基于所述初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除所述初始舆论数据中的非自然舆论数据,得到自然舆论数据;基于所述自然舆论数据,对所述对象进行舆情分析。
处理器1010还可以调用存储器1030中的逻辑指令,以执行财务预警方法,该方法包括:基于舆情分析方法,对待分析的对象进行舆情分析,得到所述对象的舆情分析结果;基于所述对象的舆情分析结果,对所述对象进行财务预警。
此外,上述的存储器1030中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、移动硬盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁碟或者光盘等各种可以存储程序代码的介质。
另一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括存储在非暂态计算机可读存储介质上的计算机程序,所述计算机程序包括程序指令,当所述程序指令被计算机执行时,计算机能够执行上述各方法实施例所提供的舆情分析方法,该方法包括:采集待分析的对象的初始舆论数据;基于所述初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除所述初始舆论数据中的非自然舆论数据,得到自然舆论数据;基于所述自然舆论数据,对所述对象进行舆情分析。
计算机还能够执行上述各方法实施例所提供的财务预警方法,该方法包括:基于舆情分析方法,对待分析的对象进行舆情分析,得到所述对象的舆情分析结果;基于所述对象的舆情分析结果,对所述对象进行财务预警。
又一方面,本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的舆情分析方法,该方法包括:采集待分析的对象的初始舆论数据;基于所述初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除所述初始舆论数据中的非自然舆论数据,得到自然舆论数据;基于所述自然舆论数据,对所述对象进行舆情分析。
本发明实施例还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现以执行上述各实施例提供的财务预警方法,该方法包括:基于舆情分析方法,对待分析的对象进行舆情分析,得到所述对象的舆情分析结果;基于所述对象的舆情分析结果,对所述对象进行财务预警。
以上所描述的装置实施例仅仅是示意性的,其中所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性的劳动的情况下,即可以理解并实施。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。

Claims (14)

1.一种舆情分析方法,其特征在于,包括:
采集待分析的对象的初始舆论数据;
基于所述初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除所述初始舆论数据中的非自然舆论数据,得到自然舆论数据;
基于所述自然舆论数据,对所述对象进行舆情分析。
2.根据权利要求1所述的舆情分析方法,其特征在于,任一用户的舆论影响参数包括所述任一用户的舆论发布数量,和/或所述任一用户的舆论传播范围;
任一用户的舆论针对性参数包括所述任一用户针对所述对象的情感倾向一致性,和/或所述任一用户在舆情高涨日期的舆论参与程度。
3.根据权利要求2所述的舆情分析方法,其特征在于,所述任一用户在舆情高涨日期的舆论参与程度的获取方法,包括如下步骤:
基于所述初始舆论数据,统计所述任一用户在所述舆情高涨日期的舆论参与情况,以及所述任一用户在所有日期的舆论参与情况;
基于所述任一用户分别在所述舆情高涨日期和所有日期的舆论参与情况,确定所述舆论参与程度。
4.根据权利要求1至3中任一项所述的舆情分析方法,其特征在于,所述基于所述自然舆论数据,对所述对象进行舆情分析,具体包括:
基于所述自然舆论数据,确定若干个舆情事件的日期区间;
基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件性质和/或事件强度。
5.根据权利要求4所述的舆情分析方法,其特征在于,所述基于所述自然舆论数据,确定若干个舆情事件的日期区间,具体包括:
基于所述自然舆论数据,确定日常舆论发布数量,以及多个日期的舆论发布数量;
若任一日期内发生预设事件,则基于所述日常舆论发布数量、所述任一日期的舆论发布数量,以及预设数量比阈值,判断所述任一日期内是否发生舆情事件;
否则,基于所述日常舆论发布数量、所述任一日期的舆论发布数量,以及通用数量比阈值,判断所述任一日期内是否发生舆情事件;
所述预设数量比阈值小于所述通用数量比阈值。
6.根据权利要求4所述的舆情分析方法,其特征在于,所述基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件性质,具体包括:
基于所述自然舆情数据中任一舆情事件的日期区间内任一用户发布的所有舆论的情感倾向,确定所述任一用户的舆情性质,所述舆情性质为正向、负向、反转为负向和反转为正向中的一种;
基于每一用户的舆情性质,确定所述任一舆情事件的事件性质。
7.根据权利要求4所述的舆情分析方法,其特征在于,所述基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件强度,具体包括:
基于所述自然舆情数据中任一舆情事件的日期区间内发布的所有舆论的情感倾向,确定所述任一舆情事件的事件基准强度;
基于所述任一舆情事件的事件基准强度,以及所述任一舆情事件的群体性质,确定所述任一舆情事件的事件强度;所述群体性质为群体性事件或个体性事件。
8.根据权利要求7所述的舆情分析方法,其特征在于,所述任一舆情事件的群体性质是基于所述任一舆情事件的日期区间,以及所述对象所属对象集合中其余各个对象的舆情事件的日期区间确定的。
9.一种财务预警方法,其特征在于,包括:
基于如权利要求1至8中任一项所述的舆情分析方法,对待分析的对象进行舆情分析,得到所述对象的舆情分析结果;
基于所述对象的舆情分析结果,对所述对象进行财务预警。
10.根据权利要求9所述的财务预警方法,其特征在于,所述基于所述对象的舆情分析结果,对所述对象进行财务预警,具体包括:
基于所述对象的舆情分析结果、所述对象的关联对象的舆情分析结果,以及所述对象与所述关联对象之间的关系,对所述对象进行财务预警。
11.一种舆情分析装置,其特征在于,包括:
舆论采集单元,用于采集待分析的对象的初始舆论数据;
舆论清洁单元,用于基于所述初始舆论数据中每一用户的舆论影响参数、舆论质量参数以及舆论针对性参数,滤除所述初始舆论数据中的非自然舆论数据,得到自然舆论数据;
舆论分析单元,用于基于所述自然舆论数据,对所述对象进行舆情分析。
12.一种财务预警装置,其特征在于,包括:
舆情分析单元,用于基于如权利要求1至8中任一项所述的舆情分析方法,对待分析的对象进行舆情分析,得到所述对象的舆情分析结果;
财务预警单元,用于基于所述对象的舆情分析结果,对所述对象进行财务预警。
13.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至8任一项所述的舆情分析方法,或权利要求9或10所述的财务预警方法的步骤。
14.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现如权利要求1至8任一项所述的舆情分析方法,或权利要求9或10所述的财务预警方法的步骤。
CN202010663122.4A 2020-07-10 2020-07-10 舆情分析和财务预警方法、装置、电子设备和存储介质 Pending CN111784492A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010663122.4A CN111784492A (zh) 2020-07-10 2020-07-10 舆情分析和财务预警方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010663122.4A CN111784492A (zh) 2020-07-10 2020-07-10 舆情分析和财务预警方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN111784492A true CN111784492A (zh) 2020-10-16

Family

ID=72768471

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010663122.4A Pending CN111784492A (zh) 2020-07-10 2020-07-10 舆情分析和财务预警方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN111784492A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117635358A (zh) * 2024-01-25 2024-03-01 山东师范大学 基于大数据的财务管理方法和系统

Citations (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN101853261A (zh) * 2009-11-23 2010-10-06 电子科技大学 一种基于社会网络的网络舆情行为分析方法
CN102929918A (zh) * 2012-09-20 2013-02-13 西北工业大学 虚假网络舆情识别方法
WO2015051752A1 (en) * 2013-10-10 2015-04-16 Beijing Zhigu Rui Tuo Tech Co., Ltd Ranking fraud detection for application
TW201614576A (en) * 2014-10-06 2016-04-16 Chunghwa Telecom Co Ltd Issue management type network public opinion evaluation and management system and method
CN105701097A (zh) * 2014-11-25 2016-06-22 四三九九网络股份有限公司 一种基于社交网络平台的舆情分析方法及系统
CN107239489A (zh) * 2017-04-21 2017-10-10 南京理工大学 基于soar模型的突发事件中网络舆情的预测与仿真方法
CN107633044A (zh) * 2017-09-14 2018-01-26 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法
CN107784083A (zh) * 2017-09-30 2018-03-09 北京合力智联科技有限公司 一种网络舆情信息有效性的自动识别处理方法
CN107908619A (zh) * 2017-11-15 2018-04-13 中国平安人寿保险股份有限公司 基于舆情监控的处理方法、装置、终端及计算机存储介质
CN107945033A (zh) * 2017-11-14 2018-04-20 李勇 一种网络舆情的分析方法、系统及相关装置
CN108052586A (zh) * 2017-12-11 2018-05-18 上海壹账通金融科技有限公司 舆情分析方法、系统、计算机设备和存储介质
CN108255805A (zh) * 2017-12-13 2018-07-06 讯飞智元信息科技有限公司 舆情分析方法及装置、存储介质、电子设备
WO2018129903A1 (zh) * 2017-01-12 2018-07-19 苏州跃盟信息科技有限公司 舆情公关方法、系统、用户终端及计算机可读存储介质
CN108776671A (zh) * 2018-05-12 2018-11-09 苏州华必讯信息科技有限公司 一种网络舆情监控系统及方法
CN109145215A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情分析方法、装置及存储介质
CN109145216A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质
CN109241518A (zh) * 2017-07-11 2019-01-18 北京交通大学 一种基于情感分析的检测网络水军方法
CN109271512A (zh) * 2018-08-29 2019-01-25 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN109508416A (zh) * 2018-11-09 2019-03-22 四川大学 基于评论数量的微博舆情事件热度与发展趋势预测方法
CN109614550A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 舆情监控方法、装置、计算机设备及存储介质
CN109670046A (zh) * 2018-11-12 2019-04-23 平安科技(深圳)有限公司 一种舆情监控方法、存储介质和终端设备
CN109710918A (zh) * 2018-11-26 2019-05-03 平安科技(深圳)有限公司 舆情关系识别方法、装置、计算机设备和存储介质
US20190197122A1 (en) * 2017-12-27 2019-06-27 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for generating review article of hot news, and terminal device
CN110232159A (zh) * 2019-05-22 2019-09-13 武汉科技大学 一种基于大数据的舆情智能分析方法
CN110287313A (zh) * 2019-05-20 2019-09-27 阿里巴巴集团控股有限公司 一种风险主体的确定方法及服务器
CN110427549A (zh) * 2019-06-20 2019-11-08 北京清博大数据科技有限公司 一种网络舆论溯源分析方法、装置、终端及存储介质
WO2019227710A1 (zh) * 2018-05-31 2019-12-05 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质
CN111008896A (zh) * 2019-12-05 2020-04-14 中国银行股份有限公司 金融风险预警方法、装置、电子设备及存储介质
CN111159399A (zh) * 2019-12-13 2020-05-15 天津大学 一种汽车垂直网站水军甄别方法
CN111209465A (zh) * 2020-01-03 2020-05-29 精硕科技(北京)股份有限公司 舆情告警方法、装置和电子设备
CN111222032A (zh) * 2019-12-17 2020-06-02 中国平安人寿保险股份有限公司 舆情分析方法及相关设备

Patent Citations (32)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101853261A (zh) * 2009-11-23 2010-10-06 电子科技大学 一种基于社会网络的网络舆情行为分析方法
CN101751458A (zh) * 2009-12-31 2010-06-23 暨南大学 一种网络舆情监控系统及方法
CN102929918A (zh) * 2012-09-20 2013-02-13 西北工业大学 虚假网络舆情识别方法
WO2015051752A1 (en) * 2013-10-10 2015-04-16 Beijing Zhigu Rui Tuo Tech Co., Ltd Ranking fraud detection for application
TW201614576A (en) * 2014-10-06 2016-04-16 Chunghwa Telecom Co Ltd Issue management type network public opinion evaluation and management system and method
CN105701097A (zh) * 2014-11-25 2016-06-22 四三九九网络股份有限公司 一种基于社交网络平台的舆情分析方法及系统
WO2018129903A1 (zh) * 2017-01-12 2018-07-19 苏州跃盟信息科技有限公司 舆情公关方法、系统、用户终端及计算机可读存储介质
CN107239489A (zh) * 2017-04-21 2017-10-10 南京理工大学 基于soar模型的突发事件中网络舆情的预测与仿真方法
CN109241518A (zh) * 2017-07-11 2019-01-18 北京交通大学 一种基于情感分析的检测网络水军方法
CN107633044A (zh) * 2017-09-14 2018-01-26 国家计算机网络与信息安全管理中心 一种基于热点事件的舆情知识图谱构建方法
CN107784083A (zh) * 2017-09-30 2018-03-09 北京合力智联科技有限公司 一种网络舆情信息有效性的自动识别处理方法
CN107945033A (zh) * 2017-11-14 2018-04-20 李勇 一种网络舆情的分析方法、系统及相关装置
CN107908619A (zh) * 2017-11-15 2018-04-13 中国平安人寿保险股份有限公司 基于舆情监控的处理方法、装置、终端及计算机存储介质
CN108052586A (zh) * 2017-12-11 2018-05-18 上海壹账通金融科技有限公司 舆情分析方法、系统、计算机设备和存储介质
CN108255805A (zh) * 2017-12-13 2018-07-06 讯飞智元信息科技有限公司 舆情分析方法及装置、存储介质、电子设备
US20190197122A1 (en) * 2017-12-27 2019-06-27 Beijing Baidu Netcom Science And Technology Co., Ltd. Method and device for generating review article of hot news, and terminal device
CN108776671A (zh) * 2018-05-12 2018-11-09 苏州华必讯信息科技有限公司 一种网络舆情监控系统及方法
WO2019227710A1 (zh) * 2018-05-31 2019-12-05 平安科技(深圳)有限公司 网络舆情的分析方法、装置及计算机可读存储介质
CN109145216A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情监控方法、装置及存储介质
CN109271512A (zh) * 2018-08-29 2019-01-25 中国平安保险(集团)股份有限公司 舆情评论信息的情感分析方法、装置及存储介质
CN109145215A (zh) * 2018-08-29 2019-01-04 中国平安保险(集团)股份有限公司 网络舆情分析方法、装置及存储介质
CN109508416A (zh) * 2018-11-09 2019-03-22 四川大学 基于评论数量的微博舆情事件热度与发展趋势预测方法
CN109670046A (zh) * 2018-11-12 2019-04-23 平安科技(深圳)有限公司 一种舆情监控方法、存储介质和终端设备
CN109710918A (zh) * 2018-11-26 2019-05-03 平安科技(深圳)有限公司 舆情关系识别方法、装置、计算机设备和存储介质
CN109614550A (zh) * 2018-12-11 2019-04-12 平安科技(深圳)有限公司 舆情监控方法、装置、计算机设备及存储介质
CN110287313A (zh) * 2019-05-20 2019-09-27 阿里巴巴集团控股有限公司 一种风险主体的确定方法及服务器
CN110232159A (zh) * 2019-05-22 2019-09-13 武汉科技大学 一种基于大数据的舆情智能分析方法
CN110427549A (zh) * 2019-06-20 2019-11-08 北京清博大数据科技有限公司 一种网络舆论溯源分析方法、装置、终端及存储介质
CN111008896A (zh) * 2019-12-05 2020-04-14 中国银行股份有限公司 金融风险预警方法、装置、电子设备及存储介质
CN111159399A (zh) * 2019-12-13 2020-05-15 天津大学 一种汽车垂直网站水军甄别方法
CN111222032A (zh) * 2019-12-17 2020-06-02 中国平安人寿保险股份有限公司 舆情分析方法及相关设备
CN111209465A (zh) * 2020-01-03 2020-05-29 精硕科技(北京)股份有限公司 舆情告警方法、装置和电子设备

Non-Patent Citations (4)

* Cited by examiner, † Cited by third party
Title
MIN-YUH DAY 等: "Deep learning for financial sentiment analysis on finance news providers", 2016 IEEE/ACMINTERNATIONALCONFERENCEONADVANCESINSOCIALNETWORKSANALYSISANDMINING, pages 163 - 164 *
熊尧;李弼程;王子?;: "基于模糊综合评判的网络舆论引导效果评估", 现代情报, no. 06 *
邹佳成;马远远;刘婷;唐伯超;刘振国;高辉;: "基于大数据的酒业舆情信息监测平台", 酿酒科技, no. 03 *
马宁;刘怡君;: "基于超网络的舆情演化多主体建模", 系统管理学报, no. 06 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN117635358A (zh) * 2024-01-25 2024-03-01 山东师范大学 基于大数据的财务管理方法和系统
CN117635358B (zh) * 2024-01-25 2024-04-16 山东师范大学 基于大数据的财务管理方法和系统

Similar Documents

Publication Publication Date Title
US10614077B2 (en) Computer system for automated assessment at scale of topic-specific social media impact
WO2017133492A1 (zh) 一种风险评估方法和系统
CN109285075B (zh) 一种理赔风险评估方法、装置及服务器
Bigonha et al. Sentiment-based influence detection on Twitter
US9524522B2 (en) Hybrid recommendation system
US20200090268A1 (en) Method and apparatus for determining level of risk of user, and computer device
US9286380B2 (en) Social media data analysis system and method
CN109615487A (zh) 基于用户行为的产品推荐方法、装置、设备及存储介质
US8341101B1 (en) Determining relationships between data items and individuals, and dynamically calculating a metric score based on groups of characteristics
EP2704089A2 (en) Hybrid recommendation system
US20140189000A1 (en) Social media impact assessment
WO2015172685A1 (en) Method and apparatus for identifying malicious account
US20130204658A1 (en) System and method for improving effectiveness of internet marketing
CN107807941A (zh) 信息处理方法和装置
WO2014207753A1 (en) Assessing value of brand based on online content
US9082087B2 (en) System and method for generating a custom revenue cycle model with automated lead movement
WO2021174699A1 (zh) 用户筛选方法、装置、设备及存储介质
Dutta et al. Design of a novel Prediction Engine for predicting suitable salary for a job
Zhang et al. Event organization 101: Understanding latent factors of event popularity
CN111784492A (zh) 舆情分析和财务预警方法、装置、电子设备和存储介质
CN117611335A (zh) 金融风险识别方法、装置、电子设备和存储介质
CN112330373A (zh) 用户行为分析方法、装置及计算机可读存储介质
CN110889716A (zh) 识别潜在注册用户的方法及装置
Kafeza et al. Exploiting time series analysis in twitter to measure a campaign process performance
Prihono et al. Comparison analysis of social influence marketing for mobile payment using support vector machine

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination