CN113326375A - 舆情处理的方法、装置、电子设备和存储介质 - Google Patents

舆情处理的方法、装置、电子设备和存储介质 Download PDF

Info

Publication number
CN113326375A
CN113326375A CN202110580891.2A CN202110580891A CN113326375A CN 113326375 A CN113326375 A CN 113326375A CN 202110580891 A CN202110580891 A CN 202110580891A CN 113326375 A CN113326375 A CN 113326375A
Authority
CN
China
Prior art keywords
data
public opinion
public
early warning
label
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110580891.2A
Other languages
English (en)
Inventor
高占宇
康思源
袁洪涛
吴磊
张慧
黄安文
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Original Assignee
Beijing Jingdong Century Trading Co Ltd
Beijing Wodong Tianjun Information Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Jingdong Century Trading Co Ltd, Beijing Wodong Tianjun Information Technology Co Ltd filed Critical Beijing Jingdong Century Trading Co Ltd
Priority to CN202110580891.2A priority Critical patent/CN113326375A/zh
Publication of CN113326375A publication Critical patent/CN113326375A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/35Clustering; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/951Indexing; Web crawling techniques

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了舆情处理的方法、装置、电子设备和存储介质,涉及计算机技术领域。该方法的一具体实施方式包括:从目标数据源中爬取舆情数据,基于舆情数据对应的数据源类型,确定舆情数据的数据类型,以调用数据类型对应的计算模型,计算舆情数据的舆情标签;判断数据类型是否为目标类型;若是,则查询数据类型对应的预警策略,基于舆情标签确定舆情数据命中的预警策略,以生成预警消息并发送;若否,则基于舆情标签,结合预设的用户信息库对舆情数据整合,得出整合结果,进而生成预警消息并发送。该实施方式能够解决现有技术中舆情处理的方式无法及时控制舆情中的风险,降低舆情风险控制准确性的问题。

Description

舆情处理的方法、装置、电子设备和存储介质
技术领域
本发明涉及计算机技术领域,尤其涉及一种舆情处理的方法、装置、电子设备和存储介质。
背景技术
随着网络技术的发展,互联网等各种公开信息也随之快速增长,所以对公开信息的舆情处理成为一个重要问题。现有技术中舆情处理的方式通常是在发生公众事件或负面事件后,对相关的舆情信息进行处理。但是在未发生公众事件或负面事件时,网络中公开信息也会存在一定的风险,而现有技术中舆情处理的方式并不适用,从而无法及时控制舆情中的风险,降低舆情风险控制的准确性。
发明内容
有鉴于此,本发明实施例提供一种舆情处理的方法、装置、电子设备和存储介质,能够解决现有技术中舆情处理的方式无法及时控制舆情中的风险,降低舆情风险控制准确性的问题。
为实现上述目的,根据本发明实施例的一个方面,提供了一种舆情处理的方法。
本发明实施例的一种舆情处理的方法包括:从目标数据源中爬取舆情数据,基于所述舆情数据对应的数据源类型,确定所述舆情数据的数据类型,以调用所述数据类型对应的计算模型,计算所述舆情数据的舆情标签;判断所述数据类型是否为目标类型;若是,则查询所述数据类型对应的预警策略,基于所述舆情标签确定所述舆情数据命中的预警策略,以生成预警消息并发送;若否,则基于所述舆情标签,结合预设的用户信息库对所述舆情数据整合,得出整合结果,进而生成预警消息并发送。
在一个实施例中,所述基于所述舆情标签,结合预设的用户信息库对所述有效数据整合,得出整合结果,包括:
基于所述舆情标签,判断所述舆情数据是否为有效数据;
若否,则不作处理;若是,则提取所述舆情数据中包括的用户属性值,从预设用户信息库中查询与所述用户属性值匹配的用户信息,以结合所述用户属性值生成对应的人物画像,进而确定为所述整合结果。
在又一个实施例中,若所述舆情数据为有效数据,则所述方法还包括:
识别所述有效数据中的异常链接,下载所述有效数据对应的工具和文件,将所述异常链接、所述工具和所述文件确定为所述整合结果。
在又一个实施例中,基于所述舆情标签确定所述舆情数据命中的预警策略,包括:
若所述数据类型属于第一类型,则基于所述舆情标签确定所述舆情数据命中的预警策略;
若所述数据类型属于第二类型,则提取所述舆情数据中关键字符,结合所述舆情标签,确定所述舆情数据命中的预警策略。
在又一个实施例中,所述舆情标签包括是否有效标签和风险等级;
所述提取所述舆情数据中关键字符,结合所述舆情标签,确定所述舆情数据命中的预警策略,包括:
判断预设的监控指标库中是否包括所述关键字符;
若是,则基于所述是否有效标签和风险等级,确定所述舆情数据命中的预警策略;
若否,则不对所述舆情数据进行处理。
在又一个实施例中,所述舆情标签包括是否有效标签和风险等级,所述关键字符包括物品属性值;
所述提取所述舆情数据中关键字符,结合所述舆情标签,确定所述舆情数据命中的预警策略,包括:
基于所述是否有效标签和风险等级确定所述舆情数据中的风险舆情数据,提取所述风险舆情数据中包括的物品属性值,以确定所述风险舆情数据对应的物品标识,从监测数据库中查询所述物品标识对应的监测数据,以确定命中的预警策略。
在又一个实施例中,所述舆情标签包括是否有效标签、风险等级和热度值;
基于所述舆情标签确定所述舆情数据命中的预警策略,包括:
基于所述是否有效标签筛选所述舆情数据中的风险舆情数据,基于所述风险舆情数据的风险等级和热度值,计算所述风险舆情数据的风险得分,以确定命中的预警策略。
为实现上述目的,根据本发明实施例的另一方面,提供了一种舆情处理的装置。
本发明实施例的一种舆情处理的装置包括:计算单元,用于从目标数据源中爬取舆情数据,基于所述舆情数据对应的数据源类型,确定所述舆情数据的数据类型,以调用所述数据类型对应的计算模型,计算所述舆情数据的舆情标签;预警单元,用于判断所述数据类型是否为目标类型;若是,则查询所述数据类型对应的预警策略,基于所述舆情标签确定所述舆情数据命中的预警策略,以生成预警消息并发送;若否,则基于所述舆情标签,结合预设的用户信息库对所述舆情数据整合,得出整合结果,进而生成预警消息并发送。
在一个实施例中,所述预警单元,具体用于:
基于所述舆情标签,判断所述舆情数据是否为有效数据;
若否,则不作处理;若是,则提取所述舆情数据中包括的用户属性值,从预设用户信息库中查询与所述用户属性值匹配的用户信息,以结合所述用户属性值生成对应的人物画像,进而确定为所述整合结果。
在又一个实施例中,所述预警单元,具体用于:
识别所述有效数据中的异常链接,下载所述有效数据对应的工具和文件,将所述异常链接、所述工具和所述文件确定为所述整合结果。
在又一个实施例中,所述预警单元,具体用于:
若所述数据类型属于第一类型,则基于所述舆情标签确定所述舆情数据命中的预警策略;
若所述数据类型属于第二类型,则提取所述舆情数据中关键字符,结合所述舆情标签,确定所述舆情数据命中的预警策略。
在又一个实施例中,所述舆情标签包括是否有效标签和风险等级;
所述预警单元,具体用于:
判断预设的监控指标库中是否包括所述关键字符;
若是,则基于所述是否有效标签和风险等级,确定所述舆情数据命中的预警策略;
若否,则不对所述舆情数据进行处理。
在又一个实施例中,所述舆情标签包括是否有效标签和风险等级,所述关键字符包括物品属性值;
所述预警单元,具体用于:
基于所述是否有效标签和风险等级确定所述舆情数据中的风险舆情数据,提取所述风险舆情数据中包括的物品属性值,以确定所述风险舆情数据对应的物品标识,从监测数据库中查询所述物品标识对应的监测数据,以确定命中的预警策略。
在又一个实施例中,所述舆情标签包括是否有效标签、风险等级和热度值;
所述预警单元,具体用于:
基于所述是否有效标签筛选所述舆情数据中的风险舆情数据,基于所述风险舆情数据的风险等级和热度值,计算所述风险舆情数据的风险得分,以确定命中的预警策略。
为实现上述目的,根据本发明实施例的再一个方面,提供了一种电子设备。
本发明实施例的一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明实施例提供的舆情处理的方法。
为实现上述目的,根据本发明实施例的又一个方面,提供了一种计算机可读介质。
本发明实施例的一种计算机可读介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明实施例提供的舆情处理的方法。
上述发明中的一个实施例具有如下优点或有益效果:本发明实施例中,从目标数据源中爬取舆情数据后,可以基于数据源的类型确定出舆情数据的数据类型,进而调用数据类型对应的计算模型,计算出舆情数据的舆情标签;然后基于舆情标签可以分别对不同数据类型的舆情数据通过不同方式进行处理。如此本发明实施例中,对爬取的舆情数据分类,并计算出对应的舆情标签,进而基于舆情标签,通过对应的方式对舆情数据进行预警,从而可以提高舆情预警的准确性,即提高了舆情风险控制的准确性;并且本发明实施例中将舆情数据与预设的用户信息结合来确定预警消息,可以将公开数据与内部数据相结合,从而提高了舆情风险控制的准确性和效率。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是根据本发明实施例的舆情处理的方法的一种主要流程的示意图;
图2是根据本发明实施例的舆情处理的方法的又一种主要流程的示意图;
图3是根据本发明实施例的舆情处理的方法的又一种主要流程的示意图;
图4是根据本发明实施例的舆情处理的装置的主要单元的示意图;
图5是本发明实施例可以应用于其中的又一种示例性系统架构图;
图6是适于用来实现本发明实施例的计算机系统的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
需要指出的是,在不冲突的情况下,本发明中的实施例以及实施例中的特征可以互相组合。
本发明实施例提供了一种舆情处理的方法,该方法可由服务端执行,如图1所示,该方法包括:
S101:从目标数据源中爬取舆情数据,基于舆情数据对应的数据源类型,确定舆情数据的数据类型,以调用数据类型对应的计算模型,计算舆情数据的舆情标签。
其中,目标数据源可以包括多种,例如可以包括新闻网站、投诉网站、社交媒体网站、羊毛党论坛、网赚论坛、破解技术论坛、人工潜伏社交群、账号交易网站、代码分享论坛、非主流聊天软件和暗网等等。本发明实施例中可以基于数据来源的不同对舆情数据进行分类。具体的,由于新闻网站、投诉网站、社交媒体网站等多应用于行业内外时事新闻知晓、口碑监测、企业形象维护等等,所以这些数据源可以划分为一个类型,从这些数据源爬取的舆情数据属于同一个数据类型,即为第一数据类型。羊毛党论坛、网赚论坛、破解技术论坛、人工潜伏社交群等数据源能够实时提供与业务风险相关的舆情,如薅羊毛信息、价格设置错误信息、被羊毛党热切关注的优惠券信息、公司业务的流程已成或网站的漏洞,多以聊天信息、贴文、提问等形式呈现,所以这些数据源可以划分为一个类型,从这些数据源爬取的舆情数据属于同一个数据类型,即为第二数据类型。平台账号交易信息、平台泄露订单信息、自动化脚本或软件、黑灰产团伙(如黑灰产工作室)发布的联络信息等数据源中数据通常公布在网上的、具有违反平台规定甚至法律法规的信息,这类信息多来自于专门的账号交易网站、代码分享论坛、非主流聊天软件和暗网,所以这些数据源爬取的舆情数据属于同一个数据类型,即为第三数据类型。
由于各类型数据源中数据所侧重的内容,起到的作用不同,所以本发明实施例中,可以为设置各数据类型对应的计算模型,以用于计算舆情数据对应的舆情标签。
需要说明的是,本发明实施例中可以通过爬虫模型从目标数据源中爬取舆情数据,并将爬取的舆情数据存储至数据库中,以便于后续处理。对于第一数据类型和第二数据类型的舆情数据,在爬取时可以根据需求或者经验设置用于爬取舆情数据的关键词。
本发明实施例中计算模型为预先设置,各数据类型对应的计算模型不同,所以各数据类型计算的舆情标签也并不相同。具体的,本发明实施例中,第一数据类型对应舆情数据的舆情标签可以包括是否有效、风险等级和热度值,第二数据类型对应舆情数据的舆情标签可以包括是否有效、风险等级和关键字符,第三数据类型的舆情标签可以包括是否有效。
由第三数据类型对应的舆情数据风险较大,所以通常可以作为溯源数据,来与内部数据结合进行溯源处理。第一数据类型和第二数据类型对应的舆情数据可以设置监控方案,以基于需求设置用于风险监控的预警策略,进而通过预警策略来预警。因此本发明实施例中,将第一数据类型和第二数据类型确定为目标类型,将第三数据类型确定为非目标类型,以分别进行不同方式的预警。
S102:判断数据类型是否为目标类型;若是,则查询数据类型对应的预警策略,基于舆情标签确定舆情数据命中的预警策略,以生成预警消息并发送;若否,则基于舆情标签,结合预设的用户信息库对舆情数据整合,得出整合结果,进而生成预警消息并发送。
由于本发明实施例中将数据类型划分为目标类型和非目标类型,所以可以先判断舆情数据的数据类型是否为目标类型。如果是,则说明舆情数据为第一数据类型或第二数据类型,可以查询数据类型对应的预警策略,基于舆情标签确定舆情数据命中的预警策略,以生成预警消息并发送;如果否,则舆情数据为第三数据类型,可以基于舆情标签,结合预设的用户信息库对舆情数据整合,得出整合结果,进而生成预警消息并发送。
具体的,第三数据类型的舆情标签可以包括是否有效,以表示舆情数据是否有预警的效果和溯源的价值,所以基于舆情标签可以从舆情数据中筛选出对预警有效、有溯源价值的舆情数据,即有效数据。在确定舆情数据为有效数据后,可以结合预设的用户信息库对舆情数据进行整合,进而得出整合结果,如此基于整合结果可以生成用于预警的预警消息,进而发送预警消息。
所以本步骤中基于舆情标签,结合预设的用户信息库对舆情数据整合,得出整合结果可以执行为:基于舆情标签,判断舆情数据是否为有效数据;若否,则不作处理;若是,则提取舆情数据中包括的用户属性值,从预设用户信息库中查询与用户属性值匹配的用户信息,以结合用户属性值生成对应的人物画像,进而确定为整合结果。
在判断出舆情数据不为有效数据时,可以不再对其进行处理。在判断出舆情数据为有效数据后,可以对其进行溯源处理,即提取舆情数据中包括的用户属性值,从预设用户信息库中查询与用户属性值匹配的用户信息,以结合用户属性值生成对应的人物画像,进而确定为整合结果。
用户属性值可以包括用户标识、名称、手机号、邮箱、论坛标识、地址信息等等。从舆情数据中提取出用户属性值后,可以将其与预设用户信息库进行匹配,即从预设用户信息库中查询与用户属性值匹配的用户信息,也就是查询出与用户属性值相一致的用户信息,如此可以将两者结合,从而可以得出用户的更多属性,进而基于此进行人物画像,将此人物画像确定为舆情数据的整合结果,来进行预警。预设用户信息库可以为基于内部数据建立,通过上述过程,可以确定出具有风险的用户,以及该用户的用户信息,并进行预警,从而提高预警效率。
进一步的,如果舆情数据中包括链接,则还可以通过调用第三方服务或人工等方式对链接进行识别,以识别出异常链接,并将异常链接备注和存储,也确定为整合结果进行预警。同时如果舆情数据中包括了工具和文件对应的信息,也可以进行下载并存储,以确定为整合结果进行预警。
需要说明的是,从预设用户信息库中查询与用户属性值匹配的用户信息时,如果未查询到匹配的用户信息,则可以通过模糊匹配得出用户信息或人工处理。本发明实施例中可以预先设置整合结果的固定模板,然后基于固定模板生成整合结果,并将整合结果存储至对应的数据库中,同时生成预警消息,以进行预警。另整合结果存储至数据库后还可以发送提示信息,以提示相关人员及时查看并处理。
第一类型和第二类型虽均为目标类型,但本发明实施例中还可以设置不同的处理方式。
对于第一类型,舆情标签可以包括是否有效标签、风险等级和热度值,其中热度值可以根据舆情数据的阅读量、点赞数、评论数、转发数、全网出现相似或关联文章数进行加权综合计算。然后基于舆情标签确定舆情数据命中的预警策略,可以具体执行为:基于是否有效标签筛选舆情数据中的风险舆情数据,基于风险舆情数据的风险等级和热度值,计算风险舆情数据的风险得分,以确定命中的预警策略。
基于是否有效标签可以筛选舆情数据中的风险舆情数据,例如若舆情数据的是否有效标签为是,则可以将其确定为风险舆情数据;若舆情数据的是否有效标签为否,则可以不对其进行处理。对于风险舆情数据可以基于风险等级和热度值,计算风险舆情数据的风险得分,例如,可以根据热度值和风险等级进行加权计算风险得分。预警策略为预先配置,具体的可以为风险得分大于风险阈值则进行预警,或者热度值大于第一分值且风险等级为“高”则进行预警等等。如此可以判断出舆情数据是否命中预警策略,以及命中哪项预警策略。
需要说明的是,若风险舆情数据为命中预警策略,则可以不对其进行处理。
对于第二类型,舆情标签可以包括是否有效标签、风险等级,则基于舆情标签确定舆情数据命中的预警策略,可以具体执行为:提取舆情数据中关键字符,结合舆情标签,确定舆情数据命中的预警策略。
关键字符可以具体为热词,进而基于热词可以生成的“热词”词云,以体现舆情数据的重点、脉络、主体等信息,进而结合是否有效标签、风险等级确定出命中的风险策略。风险策略可以根据需求设置。
关键字符可以具体为预设的监控指标,此时本步骤可以执行为:判断预设的监控指标库中是否包括关键字符;若是,则基于是否有效标签和风险等级,确定舆情数据命中的预警策略;若否,则不对舆情数据进行处理。监控指标可以基于需求设置,例如,近期某热门物品需要进行监控,可以监控指标为该物品的名称。判断预设的监控指标库中是否包括关键字符,以判断关键字符是否为预设的监控指标。在确定关键字符为监控指标后,则可以将再基于是否有效标签和风险等级,确定舆情数据命中的预警策略;在确定关键字符不为监控指标后,则可以不做处理。
关键字符还可以具体为预设的物品属性值,例如,物品名称、物品编号等等。此时本步骤可以执行为:基于是否有效标签和风险等级确定舆情数据中的风险舆情数据,提取风险舆情数据中包括的物品属性值,以确定风险舆情数据对应的物品标识,从监测数据库中查询物品标识对应的监测数据,以确定命中的预警策略。
基于是否有效标签和风险等级可以判断舆情数据是否为风险舆情数据,进而确定出舆情数据中的风险舆情数据,然后从风险舆情数据中提取出关键字符,即包括的物品属性值,进而基于提取的物品属性值可以确定处物品标识,从而可以确定出风险舆情数据对应的物品,然后可以从监测数据库中查询物品标识对应的监测数据,进而基于监测数据确定是否命中预警策略。具体的,如果监测数据出现异常,说明该物品在舆情数据和内部监测数据中均存在风险,则可以确定其命中预警策略,进行预警。
需要说明的是,舆情数据中有可能包括图片数据或链接。对于图片数据,本发明实施例中通过OCR技术识别出图片中包含的文字并去除无效或无法识别的乱码,留下可识别、且可以监测数据库相匹配的数据,例如物品编码、优惠券编码、订单编号、物品名称、价格等。对于链接,本步骤中可以筛选出包括预设字符的连接(长链接或短链接),进而识别链接对应的文本舆情并针对链接进行解析,从链接中解析出可以与监测数据库相匹配的数据,例如物品编码、优惠券编码、订单编号、物品名称、价格等。如此通过上述过程,可以实现将非结构化的、舆情数据转化为结构化的数据,然后再执行对应的处理过程。
本发明实施例中,对爬取的舆情数据分类,并计算出对应的舆情标签,进而基于舆情标签,通过对应的方式对舆情数据进行预警,从而可以提高舆情预警的准确性,即提高了舆情风险控制的准确性;并且本发明实施例中将舆情数据与预设的用户信息结合来确定预警消息,可以将公开数据与内部数据相结合,从而提高了舆情风险控制的准确性和效率。
下面结合图1所示的实施例,以关键字符为物品属性值为例,对本发明实施例中第二数据类型的舆情数据的处理方法进行具体说明。
如图2所示,该方法包括:
S201:调用第二类型对应的计算模型计算舆情数据的舆情标签。
其中,舆情标签可以包括是否有效标签和风险等级。
S202:基于是否有效标签和风险等级确定舆情数据中的风险舆情数据。
S203:提取风险舆情数据中包括的物品属性值,以确定风险舆情数据对应的物品标识,从监测数据库中查询物品标识对应的监测数据,以确定命中的预警策略。
S204:生成预警消息并发送。
需要说明的是,本发明实施例中数据处理原理已在图1所示实施例中说明,在此不再赘述。
本发明实施例中,对爬取的舆情数据分类,并计算出对应的舆情标签,进而基于舆情标签,通过对应的方式对舆情数据进行预警,从而可以提高舆情预警的准确性,即提高了舆情风险控制的准确性;并且本发明实施例中将舆情数据与预设的用户信息结合来确定预警消息,可以将公开数据与内部数据相结合,从而提高了舆情风险控制的准确性和效率。
下面结合图1所示的实施例,对本发明实施例中第三数据类型的舆情数据的处理方法进行具体说明。如图3所示,该方法包括:
S301:调用第三类型对应的计算模型计算舆情数据的舆情标签,基于舆情标签,判断舆情数据是否为有效数据。
其中,舆情数据可以包括指定数据、黑灰产软件、脚本和脚本代码、漏洞信息、可疑链接(如诈骗、赌博、钓鱼链接)等。
舆情标签可以包括是否有效标签和是否具有价值标签。是否具有价值标签可以基于有效性(是否与指定数据相关)、来源(不同情报源权重分数不同)、敏感分数(自动对情报分类,不同类型权重分数不同)、是否具有附件、链接等多个指标分数综合计算而成。
若否,则可以对舆情数据不作处理。
S302:若是,则提取舆情数据中包括的用户属性值,从预设用户信息库中查询与用户属性值匹配的用户信息,以结合用户属性值生成对应的人物画像,进而确定为整合结果。
S303:识别有效数据中的异常链接,下载有效数据对应的工具和文件,将异常链接、工具和文件确定为整合结果。
S304:将整合结果存储至数据库,生成预警消息并发送。
需要说明的是,本发明实施例中数据处理原理已在图1所示实施例中说明,在此不再赘述。
本发明实施例中,对爬取的舆情数据分类,并计算出对应的舆情标签,进而基于舆情标签,通过对应的方式对舆情数据进行预警,从而可以提高舆情预警的准确性,即提高了舆情风险控制的准确性;并且本发明实施例中将舆情数据与预设的用户信息结合来确定预警消息,可以将公开数据与内部数据相结合,从而提高了舆情风险控制的准确性和效率。
为了解决现有技术存在的问题,本发明实施例提供了一种舆情处理的装置400,如图4所示,该装置400包括:
计算单元401,用于从目标数据源中爬取舆情数据,基于所述舆情数据对应的数据源类型,确定所述舆情数据的数据类型,以调用所述数据类型对应的计算模型,计算所述舆情数据的舆情标签;
预警单元402,用于判断所述数据类型是否为目标类型;若是,则查询所述数据类型对应的预警策略,基于所述舆情标签确定所述舆情数据命中的预警策略,以生成预警消息并发送;若否,则基于所述舆情标签,结合预设的用户信息库对所述舆情数据整合,得出整合结果,进而生成预警消息并发送。
应理解的是,实施本发明实施例的方式与实施图1所示实施例的方式相同,在此不再赘述。
本发明实施例的一种实现方式中,所述预警单元402,具体用于:
基于所述舆情标签,判断所述舆情数据是否为有效数据;
若否,则不作处理;若是,则提取所述舆情数据中包括的用户属性值,从预设用户信息库中查询与所述用户属性值匹配的用户信息,以结合所述用户属性值生成对应的人物画像,进而确定为所述整合结果。
本发明实施例的又一种实现方式中,所述预警单元402,具体用于:
识别所述有效数据中的异常链接,下载所述有效数据对应的工具和文件,将所述异常链接、所述工具和所述文件确定为所述整合结果。
本发明实施例的又一种实现方式中,所述预警单元402,具体用于:
若所述数据类型属于第一类型,则基于所述舆情标签确定所述舆情数据命中的预警策略;
若所述数据类型属于第二类型,则提取所述舆情数据中关键字符,结合所述舆情标签,确定所述舆情数据命中的预警策略。
本发明实施例的又一种实现方式中,所述舆情标签包括是否有效标签和风险等级;
所述预警单元402,具体用于:
判断预设的监控指标库中是否包括所述关键字符;
若是,则基于所述是否有效标签和风险等级,确定所述舆情数据命中的预警策略;
若否,则不对所述舆情数据进行处理。
本发明实施例的又一种实现方式中,所述舆情标签包括是否有效标签和风险等级,所述关键字符包括物品属性值;
所述预警单元402,具体用于:
基于所述是否有效标签和风险等级确定所述舆情数据中的风险舆情数据,提取所述风险舆情数据中包括的物品属性值,以确定所述风险舆情数据对应的物品标识,从监测数据库中查询所述物品标识对应的监测数据,以确定命中的预警策略。
本发明实施例的又一种实现方式中,所述舆情标签包括是否有效标签、风险等级和热度值;
所述预警单元402,具体用于:
基于所述是否有效标签筛选所述舆情数据中的风险舆情数据,基于所述风险舆情数据的风险等级和热度值,计算所述风险舆情数据的风险得分,以确定命中的预警策略。
应理解的是,实施本发明实施例的方式与实施图1-3所示实施例的方式相同,在此不再赘述。
本发明实施例中,对爬取的舆情数据分类,并计算出对应的舆情标签,进而基于舆情标签,通过对应的方式对舆情数据进行预警,从而可以提高舆情预警的准确性,即提高了舆情风险控制的准确性;并且本发明实施例中将舆情数据与预设的用户信息结合来确定预警消息,可以将公开数据与内部数据相结合,从而提高了舆情风险控制的准确性和效率。
根据本发明的实施例,本发明实施例还提供了一种电子设备和一种可读存储介质。
本发明实施例的电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行本发明实施例所提供的舆情处理的方法。
图5示出了可以应用本发明实施例的舆情处理的方法或舆情处理的装置的示例性系统架构500。
如图5所示,系统架构500可以包括终端设备501、502、503,网络504和服务器505。网络504用以在终端设备501、502、503和服务器505之间提供通信链路的介质。网络504可以包括各种连接类型,例如有线、无线通信链路或者光纤电缆等等。
用户可以使用终端设备501、502、503通过网络504与服务器505交互,以接收或发送消息等。终端设备501、502、503上可以安装有各种客户端应用。
终端设备501、502、503可以是不限于智能手机、平板电脑、膝上型便携计算机和台式计算机等等。
服务器505可以是提供各种服务的服务器,服务器可以对接收到的产品信息查询请求等数据进行分析等处理,并将处理结果(例如产品信息--仅为示例)反馈给终端设备。
需要说明的是,本发明实施例所提供的舆情处理的方法一般由服务器505执行,相应地,舆情处理的装置一般设置于服务器505中。
应该理解,图5中的终端设备、网络和服务器的数目仅仅是示意性的。根据实现需要,可以具有任意数目的终端设备、网络和服务器。
下面参考图6,其示出了适于用来实现本发明实施例的计算机系统600的结构示意图。图6示出的计算机系统仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(CPU)601,其可以根据存储在只读存储器(ROM)602中的程序或者从存储部分608加载到随机访问存储器(RAM)603中的程序而执行各种适当的动作和处理。在RAM 603中,还存储有系统600操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分607;包括硬盘等的存储部分608;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入存储部分608。
特别地,根据本发明公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本发明公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本发明中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个单元、程序段、或代码的一部分,上述单元、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括计算单元和预警单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,计算单元还可以被描述为“计算单元的功能的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该设备执行时,使得该设备执行本发明所提供的舆情处理的方法。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (10)

1.一种舆情处理的方法,其特征在于,包括:
从目标数据源中爬取舆情数据,基于所述舆情数据对应的数据源类型,确定所述舆情数据的数据类型,以调用所述数据类型对应的计算模型,计算所述舆情数据的舆情标签;
判断所述数据类型是否为目标类型;若是,则查询所述数据类型对应的预警策略,基于所述舆情标签确定所述舆情数据命中的预警策略,以生成预警消息并发送;若否,则基于所述舆情标签,结合预设的用户信息库对所述舆情数据整合,得出整合结果,进而生成预警消息并发送。
2.根据权利要求1所述的方法,其特征在于,所述基于所述舆情标签,结合预设的用户信息库对所述有效数据整合,得出整合结果,包括:
基于所述舆情标签,判断所述舆情数据是否为有效数据;
若否,则不作处理;若是,则提取所述舆情数据中包括的用户属性值,从预设用户信息库中查询与所述用户属性值匹配的用户信息,以结合所述用户属性值生成对应的人物画像,进而确定为所述整合结果。
3.根据权利要求2所述的方法,其特征在于,若所述舆情数据为有效数据,则所述方法还包括:
识别所述有效数据中的异常链接,下载所述有效数据对应的工具和文件,将所述异常链接、所述工具和所述文件确定为所述整合结果。
4.根据权利要求1所述的方法,其特征在于,基于所述舆情标签确定所述舆情数据命中的预警策略,包括:
若所述数据类型属于第一类型,则基于所述舆情标签确定所述舆情数据命中的预警策略;
若所述数据类型属于第二类型,则提取所述舆情数据中关键字符,结合所述舆情标签,确定所述舆情数据命中的预警策略。
5.根据权利要求4所述的方法,其特征在于,所述舆情标签包括是否有效标签和风险等级;
所述提取所述舆情数据中关键字符,结合所述舆情标签,确定所述舆情数据命中的预警策略,包括:
判断预设的监控指标库中是否包括所述关键字符;
若是,则基于所述是否有效标签和风险等级,确定所述舆情数据命中的预警策略;
若否,则不对所述舆情数据进行处理。
6.根据权利要求4所述的方法,其特征在于,所述舆情标签包括是否有效标签和风险等级,所述关键字符包括物品属性值;
所述提取所述舆情数据中关键字符,结合所述舆情标签,确定所述舆情数据命中的预警策略,包括:
基于所述是否有效标签和风险等级确定所述舆情数据中的风险舆情数据,提取所述风险舆情数据中包括的物品属性值,以确定所述风险舆情数据对应的物品标识,从监测数据库中查询所述物品标识对应的监测数据,以确定命中的预警策略。
7.根据权利要求4所述的方法,其特征在于,所述舆情标签包括是否有效标签、风险等级和热度值;
基于所述舆情标签确定所述舆情数据命中的预警策略,包括:
基于所述是否有效标签筛选所述舆情数据中的风险舆情数据,基于所述风险舆情数据的风险等级和热度值,计算所述风险舆情数据的风险得分,以确定命中的预警策略。
8.一种舆情处理的装置,其特征在于,包括:
计算单元,用于从目标数据源中爬取舆情数据,基于所述舆情数据对应的数据源类型,确定所述舆情数据的数据类型,以调用所述数据类型对应的计算模型,计算所述舆情数据的舆情标签;
预警单元,用于判断所述数据类型是否为目标类型;若是,则查询所述数据类型对应的预警策略,基于所述舆情标签确定所述舆情数据命中的预警策略,以生成预警消息并发送;若否,则基于所述舆情标签,结合预设的用户信息库对所述舆情数据整合,得出整合结果,进而生成预警消息并发送。
9.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
10.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN202110580891.2A 2021-05-26 2021-05-26 舆情处理的方法、装置、电子设备和存储介质 Pending CN113326375A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110580891.2A CN113326375A (zh) 2021-05-26 2021-05-26 舆情处理的方法、装置、电子设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110580891.2A CN113326375A (zh) 2021-05-26 2021-05-26 舆情处理的方法、装置、电子设备和存储介质

Publications (1)

Publication Number Publication Date
CN113326375A true CN113326375A (zh) 2021-08-31

Family

ID=77421396

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110580891.2A Pending CN113326375A (zh) 2021-05-26 2021-05-26 舆情处理的方法、装置、电子设备和存储介质

Country Status (1)

Country Link
CN (1) CN113326375A (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449169A (zh) * 2021-09-01 2021-09-28 广州越创智数信息科技有限公司 一种基于rpa的舆情数据获取方法及系统
CN113780827A (zh) * 2021-09-14 2021-12-10 北京沃东天骏信息技术有限公司 一种物品筛选方法、装置、电子设备及计算机可读介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113449169A (zh) * 2021-09-01 2021-09-28 广州越创智数信息科技有限公司 一种基于rpa的舆情数据获取方法及系统
CN113780827A (zh) * 2021-09-14 2021-12-10 北京沃东天骏信息技术有限公司 一种物品筛选方法、装置、电子设备及计算机可读介质

Similar Documents

Publication Publication Date Title
US9679074B2 (en) Social genome
CN110402570B (zh) 信息处理方法和系统、服务器、终端、计算机存储介质
CN113326375A (zh) 舆情处理的方法、装置、电子设备和存储介质
JP2022533748A (ja) 機密データ管理
CN107634947A (zh) 限制恶意登录或注册的方法和装置
CN113766256A (zh) 一种直播风控方法和装置
CN108737138B (zh) 服务提供方法及服务平台
US20180012264A1 (en) Custom features for third party systems
US11599732B2 (en) Tunable system for monitoring threats to third-parties
CN108804501A (zh) 一种检测有效信息的方法及装置
CN112348661B (zh) 基于用户行为轨迹的服务策略分配方法、装置及电子设备
CN115080744A (zh) 一种数据处理的方法和装置
CN115221892A (zh) 工单数据处理方法及装置、存储介质及电子设备
CN114817346A (zh) 一种业务处理方法、装置、电子设备及计算机可读介质
CN111008373B (zh) 智能问答的处理方法、装置、计算机可读介质及电子设备
US20210209620A1 (en) Assessing Impact of Media Data Upon Brand Worth
CN113469732A (zh) 基于内容理解的审核方法、装置及电子设备
CN113592315A (zh) 一种处理纠纷单的方法和装置
US20200334595A1 (en) Company size estimation system
KR20200125824A (ko) 대화형 기업 복지 지원 추천 방법
CN116911304B (zh) 一种文本推荐方法及装置
US8892709B2 (en) Early generation of service requests
CN115618120B (zh) 一种公众号信息推送方法、系统、终端设备及存储介质
CN110019682B (zh) 用于处理信息的系统、方法和装置
CN109547226B (zh) 社群商家交互方法及装置

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination