CN113282837B - 事件分析方法、装置、计算机设备及存储介质 - Google Patents

事件分析方法、装置、计算机设备及存储介质 Download PDF

Info

Publication number
CN113282837B
CN113282837B CN202110693473.4A CN202110693473A CN113282837B CN 113282837 B CN113282837 B CN 113282837B CN 202110693473 A CN202110693473 A CN 202110693473A CN 113282837 B CN113282837 B CN 113282837B
Authority
CN
China
Prior art keywords
event
heat
curve
peak point
date
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110693473.4A
Other languages
English (en)
Other versions
CN113282837A (zh
Inventor
简晓容
马龙
李炫�
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202110693473.4A priority Critical patent/CN113282837B/zh
Publication of CN113282837A publication Critical patent/CN113282837A/zh
Application granted granted Critical
Publication of CN113282837B publication Critical patent/CN113282837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02PCLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
    • Y02P90/00Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
    • Y02P90/30Computing systems specially adapted for manufacturing

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Investigating Or Analyzing Materials Using Thermal Means (AREA)

Abstract

本申请适用于人工智能技术领域,提供了一种事件分析方法、装置、计算机设备及存储介质,该方法包括:获取与待分析事件的事件描述信息匹配的、预设时间长度内的事件新闻;根据事件新闻生成事件热度曲线;根据事件热度曲线构建热度均值曲线,确定事件热度曲线与热度均值曲线之间的热度差值曲线;根据热度差值曲线对事件热度曲线进行滤波处理得到第一候选峰值点集合;确定事件热度曲线与热度均值曲线之间峰值点的交集得到第二候选峰值点集合,根据第一候选峰值点集合和第二候选峰值点集合确定待分析事件的事件发酵日期。本申请基于待分析事件在事件热度曲线中的热度进行事件发酵日期的定位,与事件的发生日期无关,提高了事件发酵日期定位的准确性。

Description

事件分析方法、装置、计算机设备及存储介质
技术领域
本申请涉及人工智能领域,尤其涉及一种事件分析方法、装置、计算机设备及存储介质。
背景技术
随着互联网的迅猛发展,大量的事件信息以电子文本的形式出现在人们面前。为了应对事件信息爆炸带来的挑战,迫切需要一些自动化的工具帮助人们在海量信息源中迅速找到真正需要的事件信息。因此,事件分析方法应运而生。
在事件分析领域内,定位到某新闻事件在历史发生的日期至关重要,比如想知道历史上“石油大跌后美元的走势如何”,首先需要定位石油大跌在历史发生的事件发酵日期,然后根据事件发酵日期获取美元指数的价格,从而计算上涨下跌概率和涨幅分布等等,因此,在事件分析过程中,需要准确的定位到事件的发酵日期。
现有的事件分析方法过程中,均是将事件的发生日期设置为事件的发酵日期,但当事件在发生日期内并未进行事件的扩散和发酵时,导致发酵日期定位准确性低下。
发明内容
有鉴于此,本申请实施例提供了一种事件分析方法、装置、计算机设备及存储介质,以解决现有技术中,将事件的发生日期设置为事件的发酵日期,所导致的发酵日期定位准确性低下的问题。
本申请实施例的第一方面提供了一种事件分析方法,包括:
响应于接收到用于查询待分析事件的事件描述信息,获取与所述事件描述信息匹配的、预设时间长度内的事件新闻;
根据所述事件新闻的数量,确定所述待分析事件在不同日期下的事件热度,以及生成与所述待分析事件对应的事件热度曲线;
根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,以及确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线;
根据所述热度差值曲线对所述事件热度曲线进行滤波处理,得到第一候选峰值点集合,其中,所述滤波处理用于在所述事件热度曲线中筛选出峰值点;
确定所述事件热度曲线与所述热度均值曲线之间峰值点的交集,得到第二候选峰值点集合;
根据所述第一候选峰值点集合和所述第二候选峰值点集合确定所述待分析事件的事件发酵日期。
进一步地,所述确定所述事件热度曲线与所述热度均值曲线之间峰值点的交集,得到第二候选峰值点集合,包括:
根据所述热度均值曲线中的峰值点和第三预设时间间隔构建峰值点邻域;
将所述事件热度曲线中峰值点与所述峰值点邻域之间的交集,确定为所述第二候选峰值点集合。
进一步地,所述根据所述热度均值曲线中的峰值点和第三预设时间间隔构建峰值点邻域,包括:
获取所述热度均值曲线中的峰值点的日期,并根据获取到的所述峰值点的日期和所述第三预设时间间隔生成邻域区域;
确定所述热度均值曲线与所述邻域区域之间的交集,得到所述峰值点邻域。
进一步地,所述根据所述第一候选峰值点集合和所述第二候选峰值点集合确定所述待分析事件的事件发酵日期,包括:
确定所述第一候选峰值点集合与所述第二候选峰值点集合之间的交集,将交集中的每个点对应的日期确定为所述事件发酵日期。
进一步地,所述根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,包括:
根据所述第一时间间隔确定所述事件热度曲线中的日期时长,并计算所述事件热度曲线中各日期时长分别对应的热度均值;
以所述日期时长为横坐标,以及以所述热度均值为纵坐标绘制曲线,得到所述热度均值曲线。
进一步地,所述计算所述事件热度曲线中各日期时长相对应的热度均值所采用的公式为:
MA30i=heati-14+heati-13+…+heati+heati+1+…+heati+15
其中,MA30i是所述事件热度曲线中第i个日期时长相对应的热度均值,heati是所述事件热度曲线中第i天对应的事件热度。
进一步地,所述确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线,包括:
分别计算所述事件热度曲线与所述热度均值曲线在每个相同日期的热度差值;
基于所述热度差值与日期之间的对应关系构建曲线,得到所述热度差值曲线。
本申请实施例的第二方面提供了一种事件分析装置,包括:
新闻获取单元,用于响应于接收到用于查询待分析事件的事件描述信息,获取与所述事件描述信息匹配的、预设时间长度内的事件新闻;
热度曲线生成单元,用于根据所述事件新闻的数量,确定所述待分析事件在不同日期下的事件热度,以及生成与所述待分析事件对应的事件热度曲线;
均值曲线构建单元,用于根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,以及确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线;
曲线滤波单元,用于根据所述热度差值曲线对所述事件热度曲线进行滤波处理,得到第一候选峰值点集合,其中,所述滤波处理用于在所述事件热度曲线中筛选出峰值点;
发酵日期确定单元,用于确定所述事件热度曲线与所述热度均值曲线之间峰值点的交集,得到第二候选峰值点集合,根据所述第一候选峰值点集合和所述第二候选峰值点集合确定所述待分析事件的事件发酵日期。
本申请实施例的第三方面提供了一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在计算机设备上运行的计算机程序,所述处理器执行所述计算机程序时实现第一方案提供的事件分析方法的各步骤。
本申请实施例的第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现第一方案提供的事件分析方法的各步骤。
本申请实施例提供的一种事件分析方法、装置、计算机设备及存储介质,通过获取与事件描述信息匹配的、预设时间长度内的事件新闻,并根据事件新闻的数量,确定待分析事件在不同日期下的事件热度,能有效地构建待分析事件对应的事件热度曲线,基于事件热度曲线能有效地表征到待分析事件在预设时间长度内的事件热度,提高了后续事件发酵日期确定的准确性,通过根据热度差值曲线对事件热度曲线进行滤波处理,能有效地对事件热度曲线中的日期进行事件热度的筛选,通过确定事件热度曲线与热度均值曲线之间峰值点的交集,能有效地基于热度均值曲线中的峰值点对事件热度曲线进行峰值点的筛选,进一步提高了事件热度曲线中峰值点的准确性,提高了后续事件发酵日期确定的准确性,基于第一候选峰值点集合和所述第二候选峰值点集合,能有效地确定到待分析事件的事件发酵日期,本实施例,基于待分析事件在事件热度曲线中的热度进行事件发酵日期的定位,与事件的发生日期无关,防止了将事件的发生日期设置为事件的发酵日期,所导致的事件发酵日期定位准确性低下的现象,提高了事件发酵日期定位的准确性。
附图说明
为了更清楚地说明本申请实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本申请实施例提供的一种事件分析方法的实现流程图;
图2是本申请另一实施例提供的一种事件分析方法的实现流程图;
图3是本申请实施例提供的一种事件分析装置的结构框图;
图4是本申请实施例提供的一种计算机设备的结构框图。
具体实施方式
为了使本申请的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本申请进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本申请,并不用于限定本申请。
本申请实施例所涉及的事件分析方法,可以由控制设备或终端(以下称“移动终端”)执行。
请参阅图1,图1示出了本申请实施例提供的一种事件分析方法的实现流程图,该事件分析方法应用于任一计算机设备,该计算机设备可以为服务器、手机、平板或可穿戴智能设备,该事件分析方法包括:
步骤S10,响应于接收到用于查询待分析事件的事件描述信息,获取与所述事件描述信息匹配的、预设时间长度内的事件新闻。
其中,上述待分析事件,通常是待分析的事件。实践中,待分析事件可以是已经发生过的事件,也可以是尚未发生的事件。上述事件描述信息通常是用于对待分析事件进行描述的信息。事件描述信息的实现形式可以包括但不限于:文字、语音、图片等。上述预设时间长度可以是预先设定的时间长度。作为示例,上述预设时间长度可以为1个月、1年、10年等。上述事件新闻通常是与事件描述信息匹配的新闻信息。实践中,上述事件新闻通常与待分析事件相关。
在本实施例中,上述执行主体可以接收到用户输入的事件描述信息,然后从目标服务器,如提供搜索服务的搜索服务器中,获取与事件描述信息匹配的事件新闻。
可选的,该步骤中,上述获取与所述事件描述信息匹配的、预设时间长度内的事件新闻,可以包括:
从所述事件描述信息中提取所述待分析事件的事件特征,并根据所述事件特征确定所述待分析事件的事件标签。
其中,该事件特征用于表征该待分析事件的事件内容,该步骤中,通过将该待分析事件的事件特征与预存储的标签查询表进行匹配,以确定该待分析事件的事件标签,该预存储的标签查询表中存储有不同事件特征与对应事件标签之间的对应关系。
然后,将所述事件标签和所述预设时间内的新闻输入预训练后的召回模型进行召回,得到所述事件新闻。
其中,该召回模型用于分别提取该预设时间内新闻的事件标签,并输出与待分析事件的事件标签相同的新闻,得到该事件新闻,由于事件新闻与待分析事件的事件标签相同,因此,判定到召回模型输出的事件新闻。召回模型通常用于从所输入的所有新闻中提取包括有事件标签的新闻。
步骤S20,根据所述事件新闻的数量,确定所述待分析事件在不同日期下的事件热度,以及生成与所述待分析事件对应的事件热度曲线。
可选的,该步骤中,所述根据所述事件新闻的数量,确定所述待分析事件在不同日期下的事件热度,包括:
分别获取所述事件新闻的发生日期,并根据获取到的所述发生日期,分别确定不同日期下的新闻总数量;
针对的每个日期,分别查询当天的总新闻数量,并计算对应所述新闻总数量与当天的总新闻数量之间的商值,得到所述待分析事件在不同日期下的事件热度;
例如,针对预设时间长度内的日期A1,发生日期为日期A1的事件新闻的总数量为B1,日期A1当天总新闻数量为C1,则计算B1与C1之间的商值,得到该待分析事件在日期A1内的事件热度,可以理解的,针对预设时间长度内的其他日期均可以采用上述的方式进行对应事件热度的计算,在此不再进行赘述。
具体的,该步骤中,以预设时间长度内的日期为横坐标,不同日期对应的事件热度为坐标表绘制曲线,得到该待分析事件对应的事件热度曲线,该事件热度曲线用于表征待分析事件在不同日期下与对应事件热度之间的关系。
步骤S30,根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,以及确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线。
可选的,该步骤中,所述根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,包括:
根据所述第一时间间隔确定所述事件热度曲线中的日期时长,并计算所述事件热度曲线中各日期时长分别对应的热度均值;
以所述日期时长为横坐标,以及以所述热度均值为纵坐标绘制曲线,得到所述热度均值曲线;
其中,该第一预设时间间隔可以根据需求进行设置,本实施例中的第一预设时间间隔设置为30日,该步骤中,通过该事件热度曲线计算待分析事件分别在30天内热度峰值点的平均值,得到该热度均值,并根据计算得到的热度均值构建该热度均值曲线,该热度均值曲线用于表征待分析事件在不同30天间隔时间与热度均值之间的对应关系。
进一步地,该步骤中,所述计算所述事件热度曲线中各日期时长相对应的热度均值所采用的公式为:
MA30i=heati-14+heati-13+…+heati+heati+1+…+heati+15
其中,MA30i是所述事件热度曲线中第i个日期时长相对应的热度均值,heati是所述事件热度曲线中第i天对应的事件热度。
更进一步地,所述确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线,包括:分别计算所述事件热度曲线与所述热度均值曲线在每个相同日期的热度差值;基于所述热度差值与日期之间的对应关系构建曲线,得到所述热度差值曲线,其中,通过确定事件热度曲线与热度均值曲线之间的热度差值曲线,提高了后续对事件热度曲线的滤波处理的准确性。
步骤S40,根据所述热度差值曲线对所述事件热度曲线进行滤波处理,得到第一候选峰值点集合。
其中,该滤波处理用于在事件热度曲线中筛选出峰值点,该步骤中,将热度差值曲线与事件热度曲线进行曲线比对,若同一日期上,事件热度曲线中的热度值小于热度差值曲线中的热度值,则删除该事件热度曲线中的热度值对应的坐标点,以达到对该事件热度曲线的滤波效果,并将滤波处理后事件热度曲线中剩余的坐标点设置为该第一候选峰值点集合。
步骤S50,确定所述事件热度曲线与所述热度均值曲线之间峰值点的交集,得到第二候选峰值点集合,根据所述第一候选峰值点集合和所述第二候选峰值点集合确定所述待分析事件的事件发酵日期。
其中,通过确定事件热度曲线与热度均值曲线之间峰值点的交集,能有效地确定到第二候选峰值点集合,该步骤中,通过确定第一候选峰值点集合与第二候选峰值点集合之间的交集,能有效地确定到该待分析事件的事件发酵日期。
例如,当第一候选峰值点集合包括峰值点d1(1月1日)、峰值点d2(2月1日)和峰值点d3(3月1日),第二候选峰值点集合包括峰值点d4(1月1日)、峰值点d5(4月1日)和峰值点d6(5月1日)时,则第一候选峰值点集合与第二候选峰值点集合之间的交集为峰值点d1(1月1日),因此,将1月1日确定为待分析事件的事件发酵日期。
可选的,该步骤中,当第一候选峰值点集合与第二候选峰值点集合之间存在多个不同的峰值点交集时,则分别将确定到的峰值点交集对应的日期设置为待分析事件的事件发酵日期。
本实施例中,通过获取与事件描述信息匹配的、预设时间长度内的事件新闻,并根据事件新闻的数量,确定待分析事件在不同日期下的事件热度,能有效地构建待分析事件对应的事件热度曲线,基于事件热度曲线能有效地表征到待分析事件在预设时间长度内的事件热度,提高了后续事件发酵日期确定的准确性,通过根据热度差值曲线对事件热度曲线进行滤波处理,能有效地对事件热度曲线中的日期进行事件热度的筛选,通过确定事件热度曲线与热度均值曲线之间峰值点的交集,能有效地基于热度均值曲线中的峰值点对事件热度曲线进行峰值点的筛选,进一步提高了事件热度曲线中峰值点的准确性,提高了后续事件发酵日期确定的准确性,基于第一候选峰值点集合和所述第二候选峰值点集合,能有效地确定到待分析事件的事件发酵日期,本实施例,基于待分析事件在事件热度曲线中的热度进行事件发酵日期的定位,与事件的发生日期无关,防止了将事件的发生日期设置为事件的发酵日期,所导致的事件发酵日期定位准确性低下的现象,提高了事件发酵日期定位的准确性。
请参阅图2,图2是本申请另一实施例提供的一种事件分析方法的实现流程图。相对于图1实施例,本实施例提供的事件分析方法用于对图1实施例中的步骤S50作进一步细化,包括:
步骤S51,根据所述热度均值曲线中的峰值点和第三预设时间间隔构建峰值点邻域。
可选的,该步骤中,所述根据所述热度均值曲线中的峰值点和第三预设时间间隔构建峰值点邻域,包括:
获取所述热度均值曲线中的峰值点的日期,并根据获取到的所述峰值点的日期和所述第三预设时间间隔生成邻域区域;
其中,该第三预设时间间隔可以根据需求进行设置,本实施例该第三预设时间间隔设置为3天,即,该步骤中,以热度均值曲线中的峰值点为邻域中心,获取相邻3天对应的区域,得到该邻域区域,例如,当该热度均值曲线中的峰值点对应的日期为日期g时,则将热度均值曲线中日期为g-3至g+3与对应热度值之间所形成的区域设置为该邻域区域。
确定所述热度均值曲线与所述邻域区域之间的交集,得到所述峰值点邻域;
其中,通过确定热度均值曲线与邻域区域之间的交集,能有效地确定到热度均值曲线中峰值点对应的峰值点邻域,基于确定到的峰值点邻域,提高了后续第二候选峰值点集合确定的准确性。
步骤S52,将所述事件热度曲线中峰值点与所述峰值点邻域之间的交集,确定为所述第二候选峰值点集合。
其中,若事件热度曲线中的任一峰值点在该峰值点邻域中,则提取该事件热度曲线中的峰值点,并根据提取到的事件热度曲线中的峰值点构建该第二候选峰值点集合。
本实施例中,通过获取热度均值曲线中的峰值点的日期,并根据获取到的峰值点的日期和第三预设时间间隔,能有效地生成对应的邻域区域,基于生成的邻域区域与热度均值曲线之间的交集,能有效地确定到热度均值曲线中峰值点对应的峰值点邻域,基于确定得到的峰值点邻域与事件热度曲线之间的交集,能有效地确定到第二候选峰值点集合。
在本申请的所有实施例中,基于第一候选峰值点集合和第二候选峰值点集合确定待分析事件的事件发酵日期,具体来说,待分析事件的事件发酵日期由第一候选峰值点集合和第二候选峰值点集合确定得到。将待分析事件的事件发酵日期上传至区块链可保证其安全性和对用户的公正透明性。用户设备可以从区块链中下载得到该待分析事件的事件发酵日期,以便查证待分析事件的事件发酵日期是否被篡改。本示例所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
请参阅图3,图3是本申请实施例提供的一种事件分析装置100的结构框图。本实施例中该事件分析装置100包括的各单元用于执行图1、图2对应的实施例中的各步骤。具体请参阅图1、图2以及图1、图2所对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。参见图3,事件分析装置100包括:新闻获取单元10、热度曲线生成单元11、均值曲线构建单元12、曲线滤波单元13和发酵日期确定单元14,其中:
新闻获取单元10,用于响应于接收到用于查询待分析事件的事件描述信息,获取与所述事件描述信息匹配的、预设时间长度内的事件新闻。
热度曲线生成单元11,用于根据所述事件新闻的数量,确定所述待分析事件在不同日期下的事件热度,以及生成与所述待分析事件对应的事件热度曲线。
均值曲线构建单元12,用于根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,以及确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线。
其中,该均值曲线构建单元12还用于:根据所述第一时间间隔确定所述事件热度曲线中的日期时长,并计算所述事件热度曲线中各日期时长分别对应的热度均值;
以所述日期时长为横坐标,以及以所述热度均值为纵坐标绘制曲线,得到所述热度均值曲线。
可选的,所述计算所述事件热度曲线中各日期时长相对应的热度均值所采用的公式为:
MA30i=heati-14+heati-13+…+heati+heati+1+…+heati+15
其中,MA30i是所述事件热度曲线中第i个日期时长相对应的热度均值,heati是所述事件热度曲线中第i天对应的事件热度。
进一步地,该均值曲线构建单元12还用于:分别计算所述事件热度曲线与所述热度均值曲线在每个相同日期的热度差值;
基于所述热度差值与日期之间的对应关系构建曲线,得到所述热度差值曲线。
曲线滤波单元13,用于根据所述热度差值曲线对所述事件热度曲线进行滤波处理,得到第一候选峰值点集合,其中,所述滤波处理用于在所述事件热度曲线中筛选出峰值点。
发酵日期确定单元14,用于确定所述事件热度曲线与所述热度均值曲线之间峰值点的交集,得到第二候选峰值点集合,根据所述第一候选峰值点集合和所述第二候选峰值点集合确定所述待分析事件的事件发酵日期。
其中,该发酵日期确定单元14还用于:根据所述热度均值曲线中的峰值点和第三预设时间间隔构建峰值点邻域;
将所述事件热度曲线中峰值点与所述峰值点邻域之间的交集,确定为所述第二候选峰值点集合。
可选的,该发酵日期确定单元14还用于:获取所述热度均值曲线中的峰值点的日期,并根据获取到的所述峰值点的日期和所述第三预设时间间隔生成邻域区域。
进一步地,该发酵日期确定单元14还用于:确定所述第一候选峰值点集合与所述第二候选峰值点集合之间的交集,将交集中的每个点对应的日期确定为所述事件发酵日期。
本实施例中,通过获取与事件描述信息匹配的、预设时间长度内的事件新闻,并根据事件新闻的数量,确定待分析事件在不同日期下的事件热度,能有效地构建待分析事件对应的事件热度曲线,基于事件热度曲线能有效地表征到待分析事件在预设时间长度内的事件热度,提高了后续事件发酵日期确定的准确性,通过根据热度差值曲线对事件热度曲线进行滤波处理,能有效地对事件热度曲线中的日期进行事件热度的筛选,通过确定事件热度曲线与热度均值曲线之间峰值点的交集,能有效地基于热度均值曲线中的峰值点对事件热度曲线进行峰值点的筛选,进一步提高了事件热度曲线中峰值点的准确性,提高了后续事件发酵日期确定的准确性,基于第一候选峰值点集合和所述第二候选峰值点集合,能有效地确定到待分析事件的事件发酵日期,本实施例,基于待分析事件在事件热度曲线中的热度进行事件发酵日期的定位,与事件的发生日期无关,防止了将事件的发生日期设置为事件的发酵日期,所导致的事件发酵日期定位准确性低下的现象,提高了事件发酵日期定位的准确性。
图4是本申请另一实施例提供的一种计算机设备2的结构框图。如图4所示,该实施例的计算机设备2包括:处理器20、存储器21以及存储在所述存储器21中并可在所述处理器20上运行的计算机程序22,例如事件分析方法的程序。处理器20执行所述计算机程序23时实现上述各个事件分析方法各实施例中的步骤,例如图1所示的S10至S50,或者图2所示的S51至S52。或者,所述处理器20执行所述计算机程序22时实现上述图3对应的实施例中各单元的功能,例如,图3所示的单元10至14的功能,具体请参阅图3对应的实施例中的相关描述,此处不赘述。
示例性的,所述计算机程序22可以被分割成一个或多个单元,所述一个或者多个单元被存储在所述存储器21中,并由所述处理器20执行,以完成本申请。所述一个或多个单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序22在所述计算机设备2中的执行过程。例如,所述计算机程序22可以被分割成新闻获取单元10、热度曲线生成单元11、均值曲线构建单元12、曲线滤波单元13和发酵日期确定单元14,各单元具体功能如上所述。
所述计算机设备可包括,但不仅限于,处理器20、存储器21。本领域技术人员可以理解,图4仅仅是计算机设备2的示例,并不构成对计算机设备2的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述计算机设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器20可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器21可以是所述计算机设备2的内部存储单元,例如计算机设备2的硬盘或内存。所述存储器21也可以是所述计算机设备2的外部存储设备,例如所述计算机设备2上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。进一步地,所述存储器21还可以既包括所述计算机设备2的内部存储单元也包括外部存储设备。所述存储器21用于存储所述计算机程序以及所述计算机设备所需的其他程序和数据。所述存储器21还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时可实现上述各个方法实施例中的步骤。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
集成的模块如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。其中,计算机可读存储介质可以是非易失性的,也可以是易失性的。基于这样的理解,本申请实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可存储于一计算机可读存储介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,计算机程序包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读存储介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、U盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(ROM,Read-OnlyMemory)、随机存取存储器(RAM,Random Access Memory)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读存储介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如在某些司法管辖区,根据立法和专利实践,计算机可读存储介质不包括电载波信号和电信信号。
以上所述实施例仅用以说明本申请的技术方案,而非对其限制;尽管参照前述实施例对本申请进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本申请各实施例技术方案的精神和范围,均应包含在本申请的保护范围之内。

Claims (10)

1.一种事件分析方法,其特征在于,包括:
响应于接收到用于查询待分析事件的事件描述信息,获取与所述事件描述信息匹配的、预设时间长度内的事件新闻;
根据所述事件新闻的数量,确定所述待分析事件在不同日期下的事件热度,以及生成与所述待分析事件对应的事件热度曲线;
根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,以及确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线;
根据所述热度差值曲线对所述事件热度曲线进行滤波处理,得到第一候选峰值点集合,其中,所述滤波处理用于在所述事件热度曲线中筛选出峰值点;
确定所述事件热度曲线与所述热度均值曲线之间峰值点的交集,得到第二候选峰值点集合;
根据所述第一候选峰值点集合和所述第二候选峰值点集合确定所述待分析事件的事件发酵日期。
2.根据权利要求1所述的事件分析方法,其特征在于,所述确定所述事件热度曲线与所述热度均值曲线之间峰值点的交集,得到第二候选峰值点集合,包括:
根据所述热度均值曲线中的峰值点和第三预设时间间隔构建峰值点邻域;
将所述事件热度曲线中峰值点与所述峰值点邻域之间的交集,确定为所述第二候选峰值点集合。
3.根据权利要求2所述的事件分析方法,其特征在于,所述根据所述热度均值曲线中的峰值点和第三预设时间间隔构建峰值点邻域,包括:
获取所述热度均值曲线中的峰值点的日期,并根据获取到的所述峰值点的日期和所述第三预设时间间隔生成邻域区域;
确定所述热度均值曲线与所述邻域区域之间的交集,得到所述峰值点邻域。
4.根据权利要求1所述的事件分析方法,其特征在于,所述根据所述第一候选峰值点集合和所述第二候选峰值点集合确定所述待分析事件的事件发酵日期,包括:
确定所述第一候选峰值点集合与所述第二候选峰值点集合之间的交集,将交集中的每个点对应的日期确定为所述事件发酵日期。
5.根据权利要求1所述的事件分析方法,其特征在于,所述根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,包括:
根据所述第一时间间隔确定所述事件热度曲线中的日期时长,并计算所述事件热度曲线中各日期时长分别对应的热度均值;
以所述日期时长为横坐标,以及以所述热度均值为纵坐标绘制曲线,得到所述热度均值曲线。
6.根据权利要求5所述的事件分析方法,其特征在于,所述计算所述事件热度曲线中各日期时长相对应的热度均值所采用的公式为:
MA30i=heati-14+heati-13+…+heati+heati+1+…+heati+15
其中,MA30i是所述事件热度曲线中第i个日期时长相对应的热度均值,heati是所述事件热度曲线中第i天对应的事件热度。
7.根据权利要求1所述的事件分析方法,其特征在于,所述确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线,包括:
分别计算所述事件热度曲线与所述热度均值曲线在每个相同日期的热度差值;
基于所述热度差值与日期之间的对应关系构建曲线,得到所述热度差值曲线。
8.一种事件分析装置,其特征在于,包括:
新闻获取单元,用于响应于接收到用于查询待分析事件的事件描述信息,获取与所述事件描述信息匹配的、预设时间长度内的事件新闻;
热度曲线生成单元,用于根据所述事件新闻的数量,确定所述待分析事件在不同日期下的事件热度,以及生成与所述待分析事件对应的事件热度曲线;
均值曲线构建单元,用于根据所述事件热度曲线在第一时间间隔内的热度均值,构建热度均值曲线,以及确定所述事件热度曲线与所述热度均值曲线之间的热度差值曲线;
曲线滤波单元,用于根据所述热度差值曲线对所述事件热度曲线进行滤波处理,得到第一候选峰值点集合,其中,所述滤波处理用于在所述事件热度曲线中筛选出峰值点;
发酵日期确定单元,用于确定所述事件热度曲线与所述热度均值曲线之间峰值点的交集,得到第二候选峰值点集合,根据所述第一候选峰值点集合和所述第二候选峰值点集合确定所述待分析事件的事件发酵日期。
9.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7任一项所述方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。
CN202110693473.4A 2021-06-22 2021-06-22 事件分析方法、装置、计算机设备及存储介质 Active CN113282837B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110693473.4A CN113282837B (zh) 2021-06-22 2021-06-22 事件分析方法、装置、计算机设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110693473.4A CN113282837B (zh) 2021-06-22 2021-06-22 事件分析方法、装置、计算机设备及存储介质

Publications (2)

Publication Number Publication Date
CN113282837A CN113282837A (zh) 2021-08-20
CN113282837B true CN113282837B (zh) 2023-07-21

Family

ID=77285318

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110693473.4A Active CN113282837B (zh) 2021-06-22 2021-06-22 事件分析方法、装置、计算机设备及存储介质

Country Status (1)

Country Link
CN (1) CN113282837B (zh)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN116542238B (zh) * 2023-07-07 2024-03-15 和元达信息科技有限公司 一种基于小程序的事件热度趋势确定方法及系统

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933129A (zh) * 2015-06-12 2015-09-23 百度在线网络技术(北京)有限公司 基于微博的事件脉络获取方法和系统
CN109344316A (zh) * 2018-08-14 2019-02-15 优视科技(中国)有限公司 新闻热度计算方法及装置
CN110457580A (zh) * 2019-07-31 2019-11-15 百度时代网络技术(北京)有限公司 基于搜索的热点推荐方法及装置

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US9043431B2 (en) * 2008-06-06 2015-05-26 Yellowpages.Com Llc Systems and methods to plan events at different locations

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104933129A (zh) * 2015-06-12 2015-09-23 百度在线网络技术(北京)有限公司 基于微博的事件脉络获取方法和系统
CN109344316A (zh) * 2018-08-14 2019-02-15 优视科技(中国)有限公司 新闻热度计算方法及装置
CN110457580A (zh) * 2019-07-31 2019-11-15 百度时代网络技术(北京)有限公司 基于搜索的热点推荐方法及装置

Also Published As

Publication number Publication date
CN113282837A (zh) 2021-08-20

Similar Documents

Publication Publication Date Title
CN111737499B (zh) 基于自然语言处理的数据搜索方法及相关设备
CN110597511B (zh) 一种页面自动生成方法、系统、终端设备及存储介质
CN111881158B (zh) 一种管理报表数据处理方法、装置、计算机系统及可读存储介质
CN112613917A (zh) 基于用户画像的信息推送方法、装置、设备及存储介质
CN110310020B (zh) 基于数据分析的项目方案管理方法、相关装置及存储介质
CN111797629A (zh) 医疗文本数据的处理方法、装置、计算机设备和存储介质
CN114493255A (zh) 基于知识图谱的企业异常监控方法及其相关设备
CN113282837B (zh) 事件分析方法、装置、计算机设备及存储介质
CN115618415A (zh) 敏感数据识别方法、装置、电子设备和存储介质
CN112328882B (zh) 信息推荐方法、装置、终端设备及存储介质
CN114693011A (zh) 一种政策匹配方法、装置、设备和介质
CN109324963B (zh) 自动测试收益结果的方法及终端设备
CN109144999B (zh) 一种数据定位方法、装置及存储介质、程序产品
CN114971532B (zh) 一种企业画像的建立和管理方法及系统
CN114581177B (zh) 产品推荐方法、装置、设备及存储介质
CN116186223A (zh) 一种金融文本处理方法、装置、设备和存储介质
CN113343700B (zh) 数据处理方法、装置、设备及存储介质
CN112328779B (zh) 训练样本构建方法、装置、终端设备及存储介质
CN111859985B (zh) Ai客服模型测试方法、装置、电子设备及存储介质
CN113724817A (zh) 基于人工智能的知识推荐方法、装置、计算机设备及介质
CN114780688A (zh) 基于规则匹配的文本质检方法、装置、设备及存储介质
CN113849618A (zh) 基于知识图谱的策略确定方法、装置、电子设备及介质
CN113254787B (zh) 事件分析方法、装置、计算机设备及存储介质
CN113283677A (zh) 指标数据处理方法、装置、设备及存储介质
CN111815204A (zh) 风险评估方法、装置以及系统

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant