CN111159166A - 事件的预测方法及装置、存储介质及处理器 - Google Patents

事件的预测方法及装置、存储介质及处理器 Download PDF

Info

Publication number
CN111159166A
CN111159166A CN201911383185.8A CN201911383185A CN111159166A CN 111159166 A CN111159166 A CN 111159166A CN 201911383185 A CN201911383185 A CN 201911383185A CN 111159166 A CN111159166 A CN 111159166A
Authority
CN
China
Prior art keywords
events
target
event
data
time period
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911383185.8A
Other languages
English (en)
Inventor
齐中祥
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Womin High New Science & Technology Beijing Co ltd
Original Assignee
Womin High New Science & Technology Beijing Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Womin High New Science & Technology Beijing Co ltd filed Critical Womin High New Science & Technology Beijing Co ltd
Priority to CN201911383185.8A priority Critical patent/CN111159166A/zh
Publication of CN111159166A publication Critical patent/CN111159166A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/21Design, administration or maintenance of databases
    • G06F16/215Improving data quality; Data cleansing, e.g. de-duplication, removing invalid entries or correcting typographical errors
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2465Query processing support for facilitating data mining operations in structured databases
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/28Databases characterised by their database models, e.g. relational or object models
    • G06F16/284Relational databases
    • G06F16/285Clustering or classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Systems or methods specially adapted for specific business sectors, e.g. utilities or tourism
    • G06Q50/01Social networking

Abstract

本发明公开了一种事件的预测方法及装置、存储介质及处理器。该发明包括:获取第一数据;对第一数据进行分析,并得到多个事件;基于多个事件,通过预设模型输出多个事件对应的目标值;对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件。通过本发明,解决了相关技术中的社会事件预测方法中,大多基于概念模型和传播模型,导致缺乏实际数据支持的技术问题。

Description

事件的预测方法及装置、存储介质及处理器
技术领域
本发明涉及社会舆论领域,具体而言,涉及一种事件的预测方法及装置、存储介质及处理器。
背景技术
互联网的迅速发展使得各种社交网络平台相继兴起,尤其是移动终端的广泛使用使得越来越多的人通过移动社交网络平台传递信息、发表言论。移动社交网络本身所具有移动性、开放性、虚拟性、匿名性等一系列特点,使信息的发布与传播更为方便快捷,也使许多失真信息与网络谣言在移动社交网络中肆意传播,这进一步加大或扩散了社会风险。
网络舆论场,并非真实世界的映射,这是一个真正意义的“源于生活,高于生活”的信息集散场。这里几乎所有的语言都带着强烈的主观故意,同时具有秀场、发泄场甚至战场的多重属性。如果没有高屋建瓴的宏观视角和超强的技术能力进行采集、梳理和研判,普通人包括媒体可能都会迷惑于枝节的表象,忽视真正有价值的信息。
相关技术中,传统的社会事件风险预测方法中存在诸多问题,如下:
第一:大多基于概念模型和传播模型,缺乏实际数据的支撑;
第二:很多对数据的处理只是做了检测和分析,缺乏相应的预测功能;
第三:缺少基于海量数据驱动的群体性事件预测方法。
针对相关技术中存在的上述问题,目前尚未提出有效的解决方案。
发明内容
本发明的主要目的在于提供一种事件的预测方法及装置、存储介质及处理器,以解决相关技术中的社会事件预测方法中,大多基于概念模型和传播模型,导致缺乏实际数据支持的技术问题。
为了实现上述目的,根据本发明的一个方面,提供了一种事件的预测方法。该发明包括:获取第一数据;对第一数据进行分析,并得到多个事件;基于多个事件,通过预设模型输出多个事件对应的目标值;对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件。
进一步地,在获取第一数据之前,方法还包括:识别用户的身份信息;在成功识别身份信息的情况下,获取目标检索词、目标时间段和目标数据源,其中,第一数据是基于目标检索词、目标时间段和目标数据源进行采集的。
进一步地,对第一数据进行分析,并得到多个事件包括:依据singlepass聚类算法对第一数据进行事件抽取,获得多个事件;在获得多个事件后,还包括:收集多个事件对应的多个文本数据。
进一步地,在基于多个事件,通过预设模型输出多个事件对应的目标值之前,方法还包括:构建预设模型;构建预设模型包括:获取多个事件对应的文本数据;依据多个事件对应的文本数据,确定多个事件对应的情绪类别和多个事件对应的事件主题;依据多个事件对应的情绪类别和多个事件对应的事件主题,构建预设模型,其中,情绪类别包括正面情绪和负面情绪。
进一步地,在构建预设模型之后,方法还包括:确定预设时间段内发生的预定数量的群体事件和预定数量的非群体事件;将预定数量的群体事件对应的文本数据和预定数量的非群体事件对应的文本数据输入至预设模型以对预设模型进行验证。
进一步地,对目标事件进行预警处理包括:确定在目标时间段内目标事件对应的目标账号数据,其中,目标账号为提及目标事件对应的关键词的频率大于预设频率的账号;确定在目标时间段内目标文本的删除数据,其中,目标文本为包含关键词的文本;确定目标时间段内目标事件的评论数量;依据目标账号数据、目标文本的删除信息和目标事件的评论数量,构建预警曲线并输出预警曲线。
为了实现上述目的,根据本发明的另一方面,提供了一种事件的预测装置。该装置包括:第一获取单元,用于获取第一数据;分析单元,用于对第一数据进行分析,并得到多个事件;输出单元,用于基于多个事件,通过预设模型输出多个事件对应的目标值;预警单元,用于对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件。
该装置还包括:识别单元,用于在获取第一数据之前,识别用户的身份信息;第二获取单元,用于在成功识别身份信息的情况下,获取目标检索词、目标时间段和目标数据源,其中,第一数据是基于目标检索词、目标时间段和目标数据源进行采集的。
为了实现上述目的,根据本申请的另一方面,提供了一种存储介质,存储介质包括存储的程序,其中,该程序执行上述任意一项的一种事件的预测方法。
为了实现上述目的,根据本申请的另一方面,提供了一种处理器,存储介质包括存储的程序,其中,该程序执行上述任意一项的一种事件的预测方法。
通过本发明,采用以下步骤:获取第一数据;对第一数据进行分析,并得到多个事件;基于多个事件,通过预设模型输出多个事件对应的目标值;对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件,解决了相关技术中的社会事件预测方法中,大多基于概念模型和传播模型,导致缺乏实际数据支持的技术问题,进而基于提前关注社会群体事件,达到了对社会群体事件进行预警处理的效果。
附图说明
构成本发明的一部分的附图用来提供对本发明的进一步理解,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
图1是根据本发明实施例提供的一种事件的预测方法的流程图;
图2为抽样群体事件和非群体事件的IERI值排序示意图;
图3是根据本发明实施例提供的一种事件的预测平台的示意图;
图4是根据本发明实施例提供的一种事件的预测平台中包含的用户权限的示意图;以及
图5是根据本发明实施例的一种事件的预测装置的示意图。
具体实施方式
需要说明的是,在不冲突的情况下,本发明中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本发明。
为了使本技术领域的人员更好地理解本发明方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分的实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本发明保护的范围。
需要说明的是,本发明的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本发明的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
根据本发明的实施例,提供了一种事件的预测方法。
图1是根据本发明实施例提供的一种事件的预测方法的流程图。如图1所示,该发明包括以下步骤:
步骤S101,获取第一数据。
上述地,在本实施例中,通过与全网连接来获取第一数据,其中,全网包括的媒体平台至少包括以下:Facebook、Twitter、海外公网、微信、微博和国内公网等。
上述地,可以通过事件预测装置与上述各个海内网社交媒体连接来自动获取需要处理的第一数据,在另一个可选的实施例中,还可以将通过其他手段获取的全网数据导入至事件预测装置中。
进一步地,可以将获取的第一数据保存至相应的服务器存储器中。
步骤S102,对第一数据进行分析,并得到多个事件。
具体地,对获取到的第一数据进行处理,其中第一步包括对第一数据进行清洗和过滤,第二步包括对数据进行具体分析以通过庞大的第一数据将多个社会事件抽取出来。
步骤S103,基于多个事件,通过预设模型输出多个事件对应的目标值。
具体地,本实施例提供了一种预设模型,也即网情风险指数模型,将不同的事件输入至网情风险指数模型,相应地会输出不同事件对应的网情风险指数IERI(也即目标值),其中,网情风险指数IERI用于表示对应的社会事件是否已经演变为群体事件,IERI值大于零为舆论反响强烈的社会群体事件,IERI值越高表明对应的社会事件为舆论讨论越强烈的群体事件,反之,IERI值小于或者等于零为一般社会事件。
步骤S104,对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件。
具体地,通过大量的事件实验获取了一个预设值,将社会事件的网情风险指数IERI大于预设值对应的社会事件标注为目标事件,同时,将这些事件标注为目标事件进行预警处理。
需要说明的是,预设值可以为零,也可以是一个临界IERI值。
通过上述方法为相关部门及单位提供优质可靠的预警系统,为政府维稳,应对突发性事件提供有力监测、预警、分析等服务,着力防范化解重大风险,提高政府部门在网络空间的战斗力、执政力。
可选地,在获取第一数据之前,方法还包括:识别用户的身份信息;在成功识别身份信息的情况下,获取目标检索词、目标时间段和目标数据源,其中,第一数据是基于目标检索词、目标时间段和目标数据源进行采集的。
上述地,基于本申请提供的事件的预测装置,用于权限的用户可以在装置中设置搜集第一数据对应的检索词、时间段和数据源(数据源也即各个社交媒体),基于用户设置的检索词、时间段和数据源来搜集第一数据。
在另一种可选的实施例中,事件的预测模型还可以通过对预定时间段内出现的高频词语来自动确定目标检索词。
可选地,对第一数据进行分析,并得到多个事件包括:依据singlepass聚类算法对第一数据进行事件抽取,获得多个事件;在获得多个事件后,还包括:收集多个事件对应的多个文本数据。
上述地,对第一数据进行分析以将目标时间段内发生的社会事件进行抽取包括对全网数据的聚类分析,并通过聚类后的数据对多个事件进行主题识别,通过上述分析,将第一数据中包含的热点事件进行抽取,其中,优选的聚类算法为singlepass聚类算法。
进一步地,通过抽取出的热点事件,通过关键词和关键词出现的频率收集多个热点事件对应的文本数据,其中关键词是指每个社会事件中对应的关键词,例如,雷洋事件的关键词为“雷洋”。
上述地,通过事件对应的关键词收集多个热点事件对应的文本数据也许会有获取到大量的文本数据,加大数据的处理难度和效率,因此,再通过关键词对收集到的文本数据进行筛选以减小数据的处理难度。
需要说明的是,在对第一数据进行处理分析以抽取多个事件的同时还包括对事件关系识别分析、事件影响因素分析、事件分类预测分析和事件回归预测分析,以达到将多个热点事件更加精确的抽取出来。
可选地,在基于多个事件,通过预设模型输出多个事件对应的目标值之前,方法还包括:构建预设模型;构建预设模型包括:获取多个事件对应的文本数据;依据多个事件对应的文本数据,确定多个事件对应的情绪类别和多个事件对应的事件主题;依据多个事件对应的情绪类别和多个事件对应的事件主题,构建预设模型,其中,情绪类别包括正面情绪和负面情绪。
具体地,在本实施例中提供了一种利用互联网大数据和人心识别AI技术开发的一套网情风险指数IERI的技术,通过把网络空间对特定事件表达的情绪和意识形态等多维度信息集合起来,实现一套综合反映网情风险程度的量化指标体系。
其中,网情风险指数IERI影响因子包括以下各个方面:
1)舆论情绪
2)事件主题
3)意识形态
4)反映差值变化的指数:(愤怒-高兴指数、正面情绪-负面情绪指数和保守-自由指数,群体事件主要表现为负面请组指数曲线在上,正面情绪指数曲线在下,而热点事件表现为正面情绪指数曲线在上,负面情绪指数曲线在下。
因此,由大量社会事件的实践可知,对于社会群体事件(例如,问题疫苗事件、雷洋事件和仙桃抗议垃圾焚烧厂事件等),其全网的舆论情绪指数表现为负面情绪大于正面情绪,而对于热点事件(例如,舒淇结婚、李世石对战AlphaaGo、奥兰多枪击案等),其全网的舆论情绪指数表现为正面情绪大于负面情绪。
因此,通过不同事件对应的舆论情绪、事件主题和每个事件的意识形态,可以构建网情风险指数模型,通过网情风险指数模型可以确定每个事件对应的网情风险指数,通过每个事件对应的网情风险指数可以确定每个事件发展演变成群体事件的概率大小。
可选地,在构建预设模型之后,方法还包括:确定预设时间段内发生的预定数量的群体事件和预定数量的非群体事件;将预定数量的群体事件对应的文本数据和预定数量的非群体事件对应的文本数据输入至预设模型以对预设模型进行验证。
具体地,本实施例中整理了来自华东政法张XX于2016年社会群体性事件分析报告中已经定性为群体事件的的30个事件,以及新华网、搜狐网等发布的一些典型的医闹、伤医和拆迁事件。同时整理了各大主流媒体发布的一些国际、娱乐、等一些非群体事件。之后在微博时间流数据中通过关键词抽取相关事件的微博,筛选出那些确实在微博中爆发和规模大的事件。最后整理出具有风险的群体性事件和非群体事件各30个,共计60个事件,如下表格所示。
Figure BDA0002342789060000061
Figure BDA0002342789060000071
进一步地,将上述列举的群体事件和非群体事件输入网情风险指数模型输出每个事件对应的IERI值,IERI值可以有效区分不同事件,如图2所示,图2为抽样群体事件和非群体事件的IERI值排序示意图,通过图2可以看出群体负面事件集中在正区间,其他非群体事件集中在负区间上。
进一步地,通过抽样事件还可以验证IERI值的查全率和查准率,其中,网情风险指数IERI的查全率(覆盖性)在0.771时,具有96.67%的查全率。网情风险指数IERI的查准率(可靠性)在1.08时,具有96.551%的查准率。
进一步地,通过互联网大数据和人心识别AI技术开发的一套网情风险指数IERI的技术在数据-事件-预测依次深入的运用中,利用人工智能与数据挖掘实现未来事件和事件影响的有效预测,基于深度学习与自然语言处理支撑事件信息和事件关联的有效提炼。在数据层本实施例通过明网、暗网、专网三个渠道每天采集数据超过1亿条。环境-算法-应用三者有机融合,是通过现实应用的外需牵引,结合大数据环境的内因驱动,实现模型算法的落地,最终为社会事件的风险防范化解提供支撑。
可选地,对目标事件进行预警处理包括:确定在目标时间段内目标事件对应的目标账号数据,其中,目标账号为提及目标事件对应的关键词的频率大于预设频率的账号;确定在目标时间段内目标文本的删除数据,其中,目标文本为包含关键词的文本;确定目标时间段内目标事件的评论数量;依据目标账号数据、目标文本的删除信息和目标事件的评论数量,构建预警曲线并输出预警曲线。
上述地,将网情风险指数IERI的技术运用在社会事件预测的方法中,可以按小时、按天进行实时计算,这样可以灵敏预判社会事件演变为群体愤怒事件的感知和预警。
具体地,通过周期性地获取不同事件对应的IERI值,同时结合对相关事件的重点人物的社交账号进行收录,结合关键词针对性的检索重点关注人物发布的社交消息,还结合关键词展示自定义时间段内各社交平台上的删帖信息列表,并可查看删帖的传播路径分析,追根溯源,还结合舆论评论的数量来确定预警曲线,预警曲线可以预测在未来一定时间段内,社会事件对应的网情风险指数IERI的走向,如果预警曲线趋于走高,则表明某一事件在逐渐演变为群体事件,如果预警曲线区域走低,则表明某一事件的社会舆论区域平稳,演变为群体事件的几率越来越低。
因此,通过输出的预警曲线可以精确地为相关部门提供事件的应对措施和防范的手段。
需要说明的是,在输出预警曲线获取预警方案的手段中,可以根据用户选择的自定义事件周期内预测具有风险的社会事件的爆发点、里程碑、转折点等重大节点的预警,同时还可以通过微信、邮件等方式将预警方案或预警曲线发送给客户。
本发明实施例提供的一种事件的预测方法,通过获取第一数据;对第一数据进行分析,并得到多个事件;基于多个事件,通过预设模型输出多个事件对应的目标值;对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件,解决了相关技术中的社会事件预测方法中,大多基于概念模型和传播模型,导致缺乏实际数据支持的技术问题。进而基于提前关注社会群体事件,达到了对社会群体事件进行预警处理的效果。
需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
图3是根据本发明实施例提供的一种事件的预测平台的示意图。如图3所示,该平台包括:数据采集单元、服务器存储单元、算法模型单元、功能组件单元、基础服务单元、平台服务单元、应用服务单元和预警单元。
通过搭建的上述预测平台,解决了相关技术中的社会事件预测方法中,大多基于概念模型和传播模型,导致缺乏实际数据支持的技术问题。进而基于提前关注社会群体事件,达到了对社会群体事件进行预警处理的效果。
图4是根据本发明实施例提供的一种事件的预测平台中包含的用户权限的示意图。如图4所示,该预测平台中用户的权限包括以下:生成和下载报告、下载监测数据、实时监控风险事件(包括设置风险预警方案、查看方案情报、查看方案监控情况)、检索实时信息、查看重点账号情报、查看情报智能分析和查看删帖分析。
通过为用户提供上述的权限,实现了用户可以实时与事件的预测平台进行交互的目的,解决了用户实时监控社会事件的问题。
本发明实施例还提供了一种事件的预测装置,需要说明的是,本发明实施例的一种事件的预测装置可以用于执行本发明实施例所提供的用于一种事件的预测方法。以下对本发明实施例提供的一种事件的预测装置进行介绍。
图5是根据本发明实施例的一种事件的预测装置的示意图。如图5所示,该装置包括:第一获取单元501,用于获取第一数据;分析单元502,用于对第一数据进行分析,并得到多个事件;输出单元503,用于基于多个事件,通过预设模型输出多个事件对应的目标值;预警单元504,用于对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件。
本发明实施例提供的一种事件的预测装置,通过第一获取单元501,用于获取第一数据;分析单元502,用于对第一数据进行分析,并得到多个事件;输出单元503,用于基于多个事件,通过预设模型输出多个事件对应的目标值;预警单元504,用于对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件,解决了相关技术中的社会事件预测方法中,大多基于概念模型和传播模型,导致缺乏实际数据支持的技术问题。进而基于提前关注社会群体事件,达到了对社会群体事件进行预警处理的效果。
可选地,装置还包括:识别单元,用于在获取第一数据之前,识别用户的身份信息;第二获取单元,用于在成功识别身份信息的情况下,获取目标检索词、目标时间段和目标数据源,其中,第一数据是基于目标检索词、目标时间段和目标数据源进行采集的。
可选地,分析单元502包括:依据singlepass聚类算法对第一数据进行事件抽取,获得多个事件;分析单元502还包括:收集子单元,用于在获得多个事件后,收集多个事件对应的多个文本数据。
可选地,装置还包括:构建单元,用于在基于多个事件,通过预设模型输出多个事件对应的目标值之前,构建预设模型;构建单元包括:获取子单元,用于获取多个事件对应的文本数据;确定在子单元,用于依据多个事件对应的文本数据,确定多个事件对应的情绪类别和多个事件对应的事件主题;第一构建子单元,用于依据多个事件对应的情绪类别和多个事件对应的事件主题,构建预设模型,其中,情绪类别包括正面情绪和负面情绪。
可选地,装置还包括:确定单元,用于在构建预设模型之后,确定预设时间段内发生的预定数量的群体事件和预定数量的非群体事件;验证单元,用于将预定数量的群体事件对应的文本数据和预定数量的非群体事件对应的文本数据输入至预设模型以对预设模型进行验证。
可选地,预警单元504包括:第一确定子单元,用于确定在目标时间段内目标事件对应的目标账号数据,其中,目标账号为提及目标事件对应的关键词的频率大于预设频率的账号;第二确定子单元,用于确定在目标时间段内目标文本的删除数据,其中,目标文本为包含关键词的文本;第三确定子单元,用于确定目标时间段内目标事件的评论数量;第二构建子单元,用于依据目标账号数据、目标文本的删除信息和目标事件的评论数量,构建预警曲线并输出预警曲线。
一种事件的预测装置包括处理器和存储器,上述第一获取单元501等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。
处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决:相关技术中的社会事件预测方法中,大多基于概念模型和传播模型,导致缺乏实际数据支持的技术问题。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM),存储器包括至少一个存储芯片。
本发明实施例提供了一种存储介质,其上存储有程序,该程序被处理器执行时实现一种事件的预测方法。
本发明实施例提供了一种处理器,处理器用于运行程序,其中,程序运行时执行一种事件的预测方法。
本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现以下步骤:获取第一数据;对第一数据进行分析,并得到多个事件;基于多个事件,通过预设模型输出多个事件对应的目标值;对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件。
可选地,在获取第一数据之前,方法还包括:识别用户的身份信息;在成功识别身份信息的情况下,获取目标检索词、目标时间段和目标数据源,其中,第一数据是基于目标检索词、目标时间段和目标数据源进行采集的。
可选地,对第一数据进行分析,并得到多个事件包括:依据singlepass聚类算法对第一数据进行事件抽取,获得多个事件;在获得多个事件后,还包括:收集多个事件对应的多个文本数据。
可选地,在基于多个事件,通过预设模型输出多个事件对应的目标值之前,方法还包括:构建预设模型;构建预设模型包括:获取多个事件对应的文本数据;依据多个事件对应的文本数据,确定多个事件对应的情绪类别和多个事件对应的事件主题;依据多个事件对应的情绪类别和多个事件对应的事件主题,构建预设模型,其中,情绪类别包括正面情绪和负面情绪。
可选地,在构建预设模型之后,方法还包括:确定预设时间段内发生的预定数量的群体事件和预定数量的非群体事件;将预定数量的群体事件对应的文本数据和预定数量的非群体事件对应的文本数据输入至预设模型以对预设模型进行验证。
可选地,对目标事件进行预警处理包括:确定在目标时间段内目标事件对应的目标账号数据,其中,目标账号为提及目标事件对应的关键词的频率大于预设频率的账号;确定在目标时间段内目标文本的删除数据,其中,目标文本为包含关键词的文本;确定目标时间段内目标事件的评论数量;依据目标账号数据、目标文本的删除信息和目标事件的评论数量,构建预警曲线并输出预警曲线。本文中的设备可以是服务器、PC、PAD、手机等。
本发明还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有如下方法步骤的程序:获取第一数据;对第一数据进行分析,并得到多个事件;基于多个事件,通过预设模型输出多个事件对应的目标值;对目标事件进行预警处理,其中,目标事件为目标值大于预设值对应的事件。
可选地,在获取第一数据之前,方法还包括:识别用户的身份信息;在成功识别身份信息的情况下,获取目标检索词、目标时间段和目标数据源,其中,第一数据是基于目标检索词、目标时间段和目标数据源进行采集的。
可选地,对第一数据进行分析,并得到多个事件包括:依据singlepass聚类算法对第一数据进行事件抽取,获得多个事件;在获得多个事件后,还包括:收集多个事件对应的多个文本数据。
可选地,在基于多个事件,通过预设模型输出多个事件对应的目标值之前,方法还包括:构建预设模型;构建预设模型包括:获取多个事件对应的文本数据;依据多个事件对应的文本数据,确定多个事件对应的情绪类别和多个事件对应的事件主题;依据多个事件对应的情绪类别和多个事件对应的事件主题,构建预设模型,其中,情绪类别包括正面情绪和负面情绪。
可选地,在构建预设模型之后,方法还包括:确定预设时间段内发生的预定数量的群体事件和预定数量的非群体事件;将预定数量的群体事件对应的文本数据和预定数量的非群体事件对应的文本数据输入至预设模型以对预设模型进行验证。
可选地,对目标事件进行预警处理包括:确定在目标时间段内目标事件对应的目标账号数据,其中,目标账号为提及目标事件对应的关键词的频率大于预设频率的账号;确定在目标时间段内目标文本的删除数据,其中,目标文本为包含关键词的文本;确定目标时间段内目标事件的评论数量;依据目标账号数据、目标文本的删除信息和目标事件的评论数量,构建预警曲线并输出预警曲线。
本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。存储器是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
本领域技术人员应明白,本发明的实施例可提供为方法、系统或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
以上仅为本发明的实施例而已,并不用于限制本发明。对于本领域技术人员来说,本发明可以有各种更改和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的权利要求范围之内。

Claims (10)

1.一种事件的预测方法,其特征在于,包括:
获取第一数据;
对所述第一数据进行分析,并得到多个事件;
基于所述多个事件,通过预设模型输出所述多个事件对应的目标值;
对目标事件进行预警处理,其中,所述目标事件为所述目标值大于预设值对应的事件。
2.根据权利要求1所述的方法,其特征在于,在获取第一数据之前,所述方法还包括:
识别用户的身份信息;
在成功识别所述身份信息的情况下,获取目标检索词、目标时间段和目标数据源,其中,所述第一数据是基于所述目标检索词、所述目标时间段和所述目标数据源进行采集的。
3.根据权利要求2所述的方法,其特征在于,
对所述第一数据进行分析,并得到多个事件包括:依据singlepass聚类算法对所述第一数据进行事件抽取,获得所述多个事件;
在获得所述多个事件后,还包括:收集所述多个事件对应的多个文本数据。
4.根据权利要求3所述的方法,其特征在于,在基于所述多个事件,通过预设模型输出所述多个事件对应的目标值之前,所述方法还包括:
构建所述预设模型;
构建所述预设模型包括:获取多个事件对应的文本数据;依据所述多个事件对应的文本数据,确定所述多个事件对应的情绪类别和所述多个事件对应的事件主题;依据所述多个事件对应的情绪类别和所述多个事件对应的事件主题,构建所述预设模型,其中,所述情绪类别包括正面情绪和负面情绪。
5.根据权利要求4所述的方法,其特征在于,在构建所述预设模型之后,所述方法还包括:
确定预设时间段内发生的预定数量的群体事件和预定数量的非群体事件;
将所述预定数量的群体事件对应的文本数据和所述预定数量的非群体事件对应的文本数据输入至所述预设模型以对所述预设模型进行验证。
6.根据权利要求4所述的方法,其特征在于,对目标事件进行预警处理包括:
确定在目标时间段内所述目标事件对应的目标账号数据,其中,所述目标账号为提及所述目标事件对应的关键词的频率大于预设频率的账号;
确定在目标时间段内目标文本的删除数据,其中,所述目标文本为包含所述关键词的文本;
确定所述目标时间段内所述目标事件的评论数量;
依据所述目标账号数据、所述目标文本的删除信息和所述目标事件的评论数量,构建预警曲线并输出所述预警曲线。
7.一种事件的预测装置,其特征在于,包括:
第一获取单元,用于获取第一数据;
分析单元,用于对所述第一数据进行分析,并得到多个事件;
输出单元,用于基于所述多个事件,通过预设模型输出所述多个事件对应的目标值;
预警单元,用于对目标事件进行预警处理,其中,所述目标事件为所述目标值大于预设值对应的事件。
8.根据权利要求7所述的装置,其特征在于,所述装置还包括:
识别单元,用于在获取第一数据之前,识别用户的身份信息;
第二获取单元,用于在成功识别所述身份信息的情况下,获取目标检索词、目标时间段和目标数据源,其中,所述第一数据是基于所述目标检索词、所述目标时间段和所述目标数据源进行采集的。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序执行权利要求1至6中任意一项所述的一种事件的预测方法。
10.一种处理器,其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1至6中任意一项所述的一种事件的预测方法。
CN201911383185.8A 2019-12-27 2019-12-27 事件的预测方法及装置、存储介质及处理器 Pending CN111159166A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911383185.8A CN111159166A (zh) 2019-12-27 2019-12-27 事件的预测方法及装置、存储介质及处理器

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911383185.8A CN111159166A (zh) 2019-12-27 2019-12-27 事件的预测方法及装置、存储介质及处理器

Publications (1)

Publication Number Publication Date
CN111159166A true CN111159166A (zh) 2020-05-15

Family

ID=70558660

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911383185.8A Pending CN111159166A (zh) 2019-12-27 2019-12-27 事件的预测方法及装置、存储介质及处理器

Country Status (1)

Country Link
CN (1) CN111159166A (zh)

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104781837A (zh) * 2012-08-15 2015-07-15 汤姆森路透社全球资源公司 用于通过使用基于事件的情绪分析来形成预测的系统和方法
CN107566358A (zh) * 2017-08-25 2018-01-09 腾讯科技(深圳)有限公司 一种风险预警提示方法、装置、介质及设备
CN107622333A (zh) * 2017-11-02 2018-01-23 北京百分点信息科技有限公司 一种事件预测方法、装置及系统
CN107784387A (zh) * 2017-09-18 2018-03-09 国家计算机网络与信息安全管理中心 一种微博事件信息传播的连续动态预测方法
CN107797983A (zh) * 2017-04-07 2018-03-13 平安科技(深圳)有限公司 微博数据处理方法、装置、计算机设备及存储介质
US20190012591A1 (en) * 2017-07-10 2019-01-10 Accenture Global Solutions Limited System and method for detecting the occurrence of an event and determining a response to the event
CN109299271A (zh) * 2018-10-30 2019-02-01 腾讯科技(深圳)有限公司 训练样本生成、文本数据、舆情事件分类方法及相关设备
CN110245792A (zh) * 2019-06-03 2019-09-17 北京清博大数据科技有限公司 一种网络舆情预测方法、装置、终端及存储介质

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104781837A (zh) * 2012-08-15 2015-07-15 汤姆森路透社全球资源公司 用于通过使用基于事件的情绪分析来形成预测的系统和方法
CN107797983A (zh) * 2017-04-07 2018-03-13 平安科技(深圳)有限公司 微博数据处理方法、装置、计算机设备及存储介质
US20190012591A1 (en) * 2017-07-10 2019-01-10 Accenture Global Solutions Limited System and method for detecting the occurrence of an event and determining a response to the event
CN107566358A (zh) * 2017-08-25 2018-01-09 腾讯科技(深圳)有限公司 一种风险预警提示方法、装置、介质及设备
CN107784387A (zh) * 2017-09-18 2018-03-09 国家计算机网络与信息安全管理中心 一种微博事件信息传播的连续动态预测方法
CN107622333A (zh) * 2017-11-02 2018-01-23 北京百分点信息科技有限公司 一种事件预测方法、装置及系统
CN109299271A (zh) * 2018-10-30 2019-02-01 腾讯科技(深圳)有限公司 训练样本生成、文本数据、舆情事件分类方法及相关设备
CN110245792A (zh) * 2019-06-03 2019-09-17 北京清博大数据科技有限公司 一种网络舆情预测方法、装置、终端及存储介质

Similar Documents

Publication Publication Date Title
US20200186559A1 (en) Anomaly detection using cognitive computing
CN109525595B (zh) 一种基于时间流特征的黑产账号识别方法及设备
CN106897334B (zh) 一种问题推送方法和设备
CN108366045B (zh) 一种风控评分卡的设置方法和装置
Yuan et al. Mining social media data for rapid damage assessment during Hurricane Matthew: Feasibility study
CN107093431A (zh) 一种对服务质量进行质检的方法及装置
Pandhare et al. Real time road traffic event detection using Twitter and spark
CN108335693B (zh) 一种语种识别方法以及语种识别设备
CN112070120A (zh) 威胁情报的处理方法、装置、电子装置和存储介质
CN115168887B (zh) 基于差别权限隐私保护的移动终端隐身处理方法及装置
Pota et al. A subword-based deep learning approach for sentiment analysis of political tweets
Orlov et al. Using behavior and text analysis to detect propagandists and misinformers on twitter
CN109992484A (zh) 一种网络告警相关性分析方法、装置和介质
CN111898385A (zh) 一种地震灾害评估方法及系统
Bolla Crime pattern detection using online social media
US11373103B2 (en) Artificial intelligence based system and method for predicting and preventing illicit behavior
Zander et al. Trends in bushfire related tweets during the Australian ‘Black Summer’of 2019/20
Zuo et al. Crowdsourcing incident information for emergency response using open data sources in smart cities
Jogarah et al. Hybrid machine learning algorithms for fault detection in android smartphones
CN113590771A (zh) 一种数据挖掘方法、装置、设备及存储介质
CN111178701B (zh) 一种基于特征衍生技术的风险控制方法方法、装置和电子设备
CN111159166A (zh) 事件的预测方法及装置、存储介质及处理器
CN111949696A (zh) 一种全要素关联分析方法及装置
Khattar et al. Emerging role of artificial intelligence for disaster management based on microblogged communication
Thanos et al. Combined deep learning and traditional NLP approaches for fire burst detection based on twitter posts

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination