CN113590978A - 一种热点事件识别方法和系统 - Google Patents

一种热点事件识别方法和系统 Download PDF

Info

Publication number
CN113590978A
CN113590978A CN202110894868.0A CN202110894868A CN113590978A CN 113590978 A CN113590978 A CN 113590978A CN 202110894868 A CN202110894868 A CN 202110894868A CN 113590978 A CN113590978 A CN 113590978A
Authority
CN
China
Prior art keywords
event
event information
dimension
distance
hot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110894868.0A
Other languages
English (en)
Inventor
周赵云
宋平超
雷霆
田占海
钟波
梁学忠
邱祥平
杜渂
彭明喜
郝欢
徐峰
宋志豹
褚红升
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ds Information Technology Co ltd
Original Assignee
Ds Information Technology Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ds Information Technology Co ltd filed Critical Ds Information Technology Co ltd
Priority to CN202110894868.0A priority Critical patent/CN113590978A/zh
Publication of CN113590978A publication Critical patent/CN113590978A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9536Search customisation based on social or collaborative filtering
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9537Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Databases & Information Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Tourism & Hospitality (AREA)
  • Economics (AREA)
  • Strategic Management (AREA)
  • Primary Health Care (AREA)
  • General Business, Economics & Management (AREA)
  • Marketing (AREA)
  • Human Resources & Organizations (AREA)
  • General Health & Medical Sciences (AREA)
  • Health & Medical Sciences (AREA)
  • Educational Administration (AREA)
  • Development Economics (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明提供了一种热点事件识别方法和系统,其方法包括:接收若干个事件信息;计算所述事件信息在不同维度下的总相关指数;根据所述事件信息的总相关指数识别出各个所述事件信息中至少一个热点事件;对所述热点事件进行人工判别,人为筛选所述热点事件。本发明通过引入多维空间事件距离计算规则库,根据事件信息在不同维度下的总相关指数识别热点事件。解决了城市管理过程中热点事件识别、处理不及时的问题,并且及时、智能、高效地在大量城市管理事件中完成热点事件的识别与筛选,方便城市管理者在事件发展成较大热点事件前进行处置。

Description

一种热点事件识别方法和系统
技术领域
本发明专利涉及智慧城市技术领域,尤其指一种热点事件识别方法和系统。
背景技术
现代城市管理中往往需要处理各类不同的事件,这些事件通常属于不同的业务领域,归属不同的部门管理;但是事件之间一般是存在关联关系的,现实世界中,一个事件可以引发一系列次生事件,事件的类型可能不同、归属部门也不同,但却有可能是一个事件簇,具有因果关系,比如阴井盖的丢失可能导致交通事故等。传统的事件处置方法往往是一事一处置,没有建立事件之间的关系,由于事件之间相互孤立,因此缺乏自动识别热点事件的能力。现代的智慧城市管理,更加注重事件处置的及时、智能、高效;需要在事件发展为大的热点事件之前就得到及时处置,将隐患消灭在萌芽状态。针对这种需求,显然一事一处置的传统方法无法适应。
发明内容
本发明的目的是提供一种热点事件识别方法和系统,解决城市管理过程中热点事件识别、处理不及时的问题,从而有效智能识别热点事件,并将识别的热点事件推荐给城市管理者,从而帮助管理者及时确认热点事件、快速处置,提高管理效率。
为实现本发明以上的发明目的,本发明是通过以下技术方案实现的:
本发明提供一种热点事件识别方法,包括步骤:
接收若干个事件信息;
计算所述事件信息在不同维度下的总相关指数;
根据所述事件信息的总相关指数识别出各个所述事件信息中至少一个热点事件;
对所述热点事件进行人工判别,人为筛选所述热点事件。
该技术方案可以解决在城市管理过程中,难以在含有大量信息的城市管理事件信息库中识别热点事件的问题。通过对事件信息在不同维度下总相关指数的计算,客观衡量任意两个事件信息的关联程度,根据事件信息的总相关指数自动识别出热点事件,使城市管理工作更加及时、高效、智能,可以在热点事件尚未发展成影响较大的事件时及时处置。在识别热点事件之后,交由人工对热点事件作进一步的筛选,提高热点事件识别的准确性。本发明的技术方案可以做到城市管理过程中及时识别热点事件与准确识别热点事件的平衡。
进一步地,本发明还提供一种热点事件识别方法,在所述接收事件信息前,还包括:
预先建立多维空间事件距离计算规则库,所述计算规则库用于计算所述事件信息在不同维度下的总相关指数,所述维度包括时间维度、空间维度、类别维度、属性维度。
进一步地,根据上述的一种热点事件识别方法,所述计算所述事件信息在不同维度下的总相关指数,包括:
计算任意两个所述事件信息在各个维度下的距离;
将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数;
基于任意两个所述事件信息在各个维度下的相关指数,计算任意两个所述事件信息在不同维度下的总相关指数。
进一步地,本发明还提供一种热点事件识别方法,所述计算任意两个所述事件信息在各个维度下的距离,包括:
计算任意两个所述事件信息在时间维度下的起始时间差、结束时间差,以及一个事件信息起始时间与另一事件信息结束时间的时间差,所述时间差为任意两个所述事件信息在时间维度的距离;
和/或计算任意两个所述事件信息在空间维度下的距离,所述距离为任意两个所述事件信息在空间维度下的距离;
和/或计算任意两个所述事件信息在类别维度下的关联系数,所述关联系数为任意两个所述事件信息在类别维度下的距离,所述关联系数由不同类别间的预设的关联系数二维矩阵获得;
和/或计算任意两个所述事件信息在属性维度下的相同关键字的数量,所述相同关键字数量为任意两个所述事件信息在属性维度的距离。
进一步地,本发明还提供一种热点事件识别方法,其特征在于,在将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数前,还包括:
预先建立多维空间距离与相关指数换算的换算二维矩阵,所述换算二维矩阵用于将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数。
进一步地,本发明还提供一种热点事件识别方法,其特征在于,计算任意两个所述事件信息在不同维度下的总相关指数,包括:
排除所述事件信息中相关指数小于预设阈值的维度;
计算所述事件信息中剩余各个维度的相关指数乘积为所述事件信息在不同维度下的总相关指数。
进一步地,本发明还提供一种热点事件识别方法,所述将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数,还包括:
若所述事件信息具有多个类别,则分别计算各个类别的子相关指数;
将各个类别的子相关指数的和作为所述事件信息总的类别维度的相关指数。
进一步地,本发明还提供一种热点事件识别方法,所述根据所述事件信息的总相关指数识别出各个所述事件信息中至少一个热点事件,包括:
基于所述事件信息总相关指数生成有向图,当所述事件信息的总相关指数大于预设总相关指数阈值时,所述事件信息在有向图中为连接关系;
根据所述有向图中事件信息的出度识别热点事件,当所述有向图中所述事件信息出度大于预设出度阈值时,识别所述事件信息为热点事件,和/或,根据所述有向图中事件信息的出度大小排序,当所述事件信息的排序号在某一预设区间内时,识别所述事件信息为热点事件。
进一步地,本发明还提供一种热点事件识别系统,包括:
接收模块,用于接收若干个事件信息;
计算模块,与所述接收模块连接,计算所述事件信息在不同维度下的总相关指数;
识别模块,根据所述事件信息的总相关指数识别出各个所述事件信息中至少一个热点事件;
显示模块,用于将所述热点事件显示给用户,通过用户对所述热点事件进行人工判别,人为筛选所述热点事件;
多维空间事件距离计算规则库,所述计算规则库中储存有计算所述事件信息在不同维度下的总相关指数的规则,所述不同维度包括时间维度、空间维度、类别维度、属性维度。
进一步地,本发明还提供一种热点事件识别系统,其中所述计算模块,包括:
距离计算单元,用于计算任意两个所述事件信息在各个维度下的距离;
换算单元,用于将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数;
总相关指数计算单元,用于基于任意两个所述事件信息在各个维度下的相关指数,计算任意两个所述事件信息在不同维度下的总相关指数;
所述距离计算单元用于计算任意两个所述事件信息在时间维度下的起始时间差、结束时间差,以及一个事件信息起始时间与另一事件信息结束时间的时间差,所述时间差为任意两个所述事件信息在时间维度的距离;
和/或计算任意两个所述事件信息在空间维度下的距离,所述距离为任意两个所述事件信息在空间维度下的距离;
和/或计算任意两个所述事件信息在类别维度下的关联系数,所述关联系数为任意两个所述事件信息在类别维度下的距离,所述关联系数由不同类别间的预设的关联系数二维矩阵获得;
和/或计算任意两个所述事件信息在属性维度下的相同关键字的数量,所述相同关键字数量为任意两个所述事件信息在属性维度的距离;
所述换算单元中包括多维空间距离与相关指数换算的换算二维矩阵;
所述总相关指数计算单元用于排除所述事件信息中相关指数小于预设阈值的维度,计算所述事件信息中剩余各个维度的相关指数乘积为所述事件信息在不同维度下的总相关指数。
本发明提供一种热点事件识别方法和系统,至少具有以下增益效果:
1)可以及时、智能、高效的在大量城市管理事件中完成热点事件的识别与筛选,方便城市管理者在事件发展成较大热点事件前进行处置;
2)可以根据事件信息,引入多维空间事件距离计算规则来判断事件间相关指数,基于事件间相关指数识别热点事件,本发明的识别方法可以降低对接收的事件信息数据的要求;
3)本发明的热点事件识别方法是一个通用的识别方法,针对不同事件类型和领域,通过配置相应的多维空间事件距离计算规则库便可以实现不同领域事件的识别,具有很好的领域适应性;
4)本发明的热点事件识别方法是基于事件间相关性识别热点事件,使热点事件识别不是依据关注度而是依据逻辑关系,不依赖事件信息中关注度数据,可以在事件尚未取得更高关注度时,更早的识别和处置热点事件。
附图说明
下面将以明确易懂的方式,结合附图说明优选实施方式,对一种热点事件识别方法和系统的上述特性、技术特征、优点及其实现方式予以进一步说明。
图1是本发明实施例的整体流程图;
图2是本发明一个实施例的流程图;
图3是本发明计算事件信息在各个维度下距离实施例的流程图;
图4是本发明另一个实施例的流程图;
图5是本发明识别事件信息中热点事件实施例的流程图;
图6是本发明中事件信息有向图的示例图;
图7是本发明实施例的系统结构示意图;
图中标号:10-接收模块、20-计算模块、30-识别模块、40-显示模块、50-多维空间事件距离计算规则库、21-距离计算单元、22-换算单元、23-总相关指数计算单元。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本申请实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其他实施例中也可以实现本申请。在其他情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本申请的描述。
应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”指示所述描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其他特征、整体、步骤、操作、元素、组件和/或集合的存在或添加。
为使图面简洁,各图中只示意性地表示出了与本发明相关的部分,它们并不代表其作为产品的实际结构。另外,以使图面简洁便于理解,在有些图中具有相同结构或功能的部件,仅示意性地绘示了其中的一个,或仅标出了其中的一个。在本文中,“一个”不仅表示“仅此一个”,也可以表示“多于一个”的情形。
还应当进一步理解,在本申请说明书和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
另外,在本申请的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对照附图说明本发明的具体实施方式。显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,并获得其他的实施方式。
实施例1
本发明的一个实施例,如图1所示,本发明提供一种热点事件识别方法,包括步骤:
S100建立多维空间事件距离计算规则库。
具体地,计算规则库用于计算事件信息在不同维度下的总相关指数,维度包括时间维度、空间维度、类别维度、属性维度。
S200接收若干个事件信息。
具体地,在接收若干个事件信息时可以采用实时、准实时、或者批量的方式接收多个来源、多种类型的事件消息。其中,准实时接收事件信息指接收存在一定数据延迟的事件信息,批量接收事件信息指访问城市管理事件信息数据库后,统一接收事件信息。
示例性地,采用实时方式接收报警信息等非延时类事件信息,采用准实时方式接收治安管理事件信息等需要处理才会上报的延迟类事件信息,采用批量方式接收城市月新增企业信息等按一定周期批量访问数据库获得的事件信息。
优选地,在接收若干个事件信息之后,根据事件来源、内容等,采用自动或者人工方式标记类型;一个事件可以标记多个类型。
优选地,当事件信息可以确定空间位置时,采用自动或者人工方式标记位置属性。
优选地,当事件信息可以确定发生地时间,需要采用自动或者人工方式标记时间属性;时间属性有事件发生的时间、进入系统的时间、被系统处理的时间等不同,需要根据业务规则来选择那种时间作为计算依据。
优选地,采用分词系统提取事件信息中关键字;每个事件信息的关键字可以有多个。
S300计算事件信息在不同维度下的总相关指数。
具体地,根据事件信息与多维空间事件距离计算规则库计算事件信息在各个维度的相关指数,再根据各个维度的相关指数,排除事件信息中相关指数小于预设阈值的维度;计算事件信息中剩余各个维度的相关指数乘积为事件信息在不同维度下的总相关指数。
优选地,为了缩小计算范围,可以根据事件的时间、状态等做筛选和过滤,比如只和没有关闭的事件做相关性计算或只和发生在24小时内的事件做相关性计算。
优选地,对于重复事件,后续重复事件不再单独计算相关性,比如多人上报了同一个火灾的事件信息只做一次计算。
S400根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件。
S500对热点事件进行人工判别,人为筛选热点事件。
具体地,在S400根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件后,将热点事件呈现给用户。自动识别出的热点事件,有可能并非真正的热点,所以人工判别是必要的。人工判别就是根据系统展现的热点事件,人工判断事件的内容、位置、类型、以及与其他事件的关联关系等方面,判断是否为热点事件;如果是的话,即启动相应处置流程。
本实施例利用不同维度的距离计算出事件之间的相关指数,并以有向图的方式计算当前最热点的事件,具有实时、高效的特点。并且在不同的领域中,通过定制本领域的距离计算规则库,可以很方便适应特定领域需求,具有非常高的适应性。可以解决城市管理过程中热点事件识别、处理不及时的问题,并且及时、智能、高效的在大量城市管理事件中完成热点事件的识别与筛选,方便城市管理者在事件发展成较大热点事件前进行处置。
实施例2
本发明的另一个实施例,如图2所示,本发明提供一种热点事件识别方法,包括步骤:
S100预先建立多维空间事件距离计算规则库。
具体地,计算规则库用于计算事件信息在不同维度下的总相关指数,维度包括时间维度、空间维度、类别维度、属性维度。
S200接收若干个事件信息。
具体地,在接收若干个事件信息时可以采用实时、准实时、或者批量的方式接收多个来源、多种类型的事件消息。其中,准实时接收事件信息指接收存在一定数据延迟的事件信息,批量接收事件信息指访问城市管理事件信息数据库后,统一接收事件信息。
示例性地,采用实时方式接收报警信息等非延时类事件信息,采用准实时方式接收治安管理事件信息等需要处理才会上报的延迟类事件信息,采用批量方式接收城市月新增企业信息等按一定周期批量访问数据库获得的事件信息。
优选地,在接收若干个事件信息之后,根据事件来源、内容等,采用自动或者人工方式标记类型;一个事件可以标记多个类型。
优选地,当事件信息可以确定空间位置时,采用自动或者人工方式标记位置属性。
优选地,当事件信息可以确定发生地时间,需要采用自动或者人工方式标记时间属性;时间属性有事件发生的时间、进入系统的时间、被系统处理的时间等不同,需要根据业务规则来选择那种时间作为计算依据。
优选地,采用分词系统提取事件信息中关键字;每个事件信息的关键字可以有多个。
S310计算任意两个事件信息在各个维度下的距离。
具体地,距离的概念在不同维度中含义有所不同,比如在空间属性中二维平面坐标系内,两个点的距离可以是直线距离、或者同一条路上的两个点的沿路距离;在时间维度,距离则是时间差;在类型维度,距离是两个类型之间的关联系数;在属性维度,是相同关键字的数量为属性维度的距离等;用户也可以自己定义不同维度中距离的衡量标准。
S320将任意两个事件信息在各个维度下的距离换算成任意两个事件信息在各个维度下的相关指数。
具体地,在S320将任意两个事件信息在各个维度下的距离换算成任意两个事件信息在各个维度下的相关指数前,可以预先建立多维空间距离与相关指数换算的换算二维矩阵,换算二维矩阵用于将任意两个事件信息在各个维度下的距离换算成任意两个事件信息在各个维度下的相关指数。针对不同维度,距离计算方式不同,但是基本模型是距离越近,相关指数越高;距离越远,相关指数越低,当距离超过某个阈值时,相关指数降为最低值0。
优选地,时间维度可以根据时间早于或晚于本事件时间,相关指数计算有所差别。
S330基于任意两个事件信息在各个维度下的相关指数,计算任意两个事件信息在不同维度下的总相关指数。
优选地,为了缩小计算范围,可以根据事件的时间、状态等做筛选和过滤,比如只和没有关闭的事件做相关性计算或只和发生在24小时内的事件做相关性计算。
优选地,对于重复事件,后续重复事件不再单独计算相关性,比如多人上报了同一个火灾的事件信息只做一次计算。
S400根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件。
S500对热点事件进行人工判别,人为筛选热点事件。
具体地,在S400根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件后,将热点事件呈现给用户。自动识别出的热点事件,有可能并非真正的热点,所以人工判别是必要的。人工判别就是根据系统展现的热点事件,人工判断事件的内容、位置、类型、以及与其他事件的关联关系等方面,判断是否为热点事件;如果是的话,即启动相应处置流程。
本实施例利用不同维度的距离计算出事件之间的相关指数,并以有向图的方式计算当前最热点的事件,具有实时、高效的特点。并且在不同的领域中,通过定制本领域的距离计算规则库,可以很方便适应特定领域需求,具有非常高的适应性。可以解决城市管理过程中热点事件识别、处理不及时的问题,并且可以根据事件信息,引入多维空间事件距离计算规则来判断事件间相关指数,基于事件间相关指数识别热点事件,本发明的识别方法可以降低对接收的事件信息数据的要求。
实施例3
本发明的一个实施例,在实施例1或2的基础上,其中,计算任意两个事件信息在各个维度下的距离,包括步骤:
S311计算任意两个事件信息在时间维度下的起始时间差、结束时间差,以及一个事件信息起始时间与另一事件信息结束时间的时间差为时间维度的距离。
S312计算任意两个事件信息在空间维度下的距离为空间维度下的距离。
优选地,空间维度可以根据事件的空间位置类型,分为点、线、面之间距离运算,比如点与点、点与线、线与面等。
进一步优选地,空间维度距离的计算,可以跟空间对象的形态有特定关系,比如事件沿路的距离才有意义,如果离开了道路,即使直线距离很近,也视为超过最大阈值;或者发生在同一个园区内才视为有效距离,离开园区范围视为超过最大阈值,当距离超过最大阈值时相关指数为极小值0。
S313计算任意两个事件信息在类别维度下的关联系数为类别维度的距离,关联系数由不同类别间的预设的关联系数二维矩阵获得。
具体地,在S313计算任意两个事件信息在类别维度下的关联系数前,应该预先建立不同类别间的关联系数二维矩阵,通过比对两个事件之间类别,直接得出两个事件之间关联系数。
示例性的,两个事件之间关联系数可以为0,表示这两种类型间没有相关性;关联系数越高表示越相关,最高为10。火灾类型与急救类型之间距离为8,交通事故类型与交通拥堵类型之间距离为9,火灾类型与交通拥堵类型之间距离为5,交通拥堵类型与城市卫生类型之间距离为0。事件可以有多个类型,两个事件之间多个类型的相关系数的和即为两个事件之间的类型相关系数;如果累加值大于10,则取10为最终值。
S314计算任意两个事件信息在属性维度下的相同关键字的数量为属性维度的距离。
具体地,在属性维度是根据事件的内容,采用分词的方式提取关键字。属性维度的距离的最低为0;最高为10;如果两个事件间的相同关键字超过10,则取10为最大值。
本实施例利用不同维度的距离计算出事件之间的相关指数,并以有向图的方式计算当前最热点的事件,具有实时、高效的特点。并且在不同的领域中,通过定制本领域的距离计算规则库,可以很方便适应特定领域需求,具有非常高的适应性。可以解决城市管理过程中热点事件识别、处理不及时的问题。本实施例中的热点事件识别方法是一个通用的识别方法,针对不同事件类型和领域,通过配置相应的多维空间事件距离计算规则库便可以实现不同领域事件的识别,具有很好的领域适应性。
实施例4
本发明的一个实施例,如图3所示,在实施例1至3任一实施例的基础上,计算任意两个事件信息在不同维度下的总相关指数,包括步骤:
S331排除事件信息中相关指数小于预设阈值的维度。
S332计算事件信息中剩余各个维度的相关指数乘积为事件信息在不同维度下的总相关指数。
示例性地,相关指数最小值为0,表示不相关;最大值为10。两个事件总的相关指数是这两个事件在各维度相关指数的乘积,为了避免0值的干扰,计算乘积时需要将小于预设阈值的维度去掉。预设阈值可以设置为1。
实施例5
本发明的一个实施例,如图4所示,本发明还提供一种热点事件识别方法,包括步骤:
S100预先建立多维空间事件距离计算规则库。
具体地,计算规则库用于计算事件信息在不同维度下的总相关指数,维度包括时间维度、空间维度、类别维度、属性维度。
S200接收若干个事件信息。
具体地,在接收若干个事件信息时可以采用实时、准实时、或者批量的方式接收多个来源、多种类型的事件消息。其中,准实时接收事件信息指接收存在一定数据延迟的事件信息,批量接收事件信息指访问城市管理事件信息数据库后,统一接收事件信息。
示例性地,采用实时方式接收报警信息等非延时类事件信息,采用准实时方式接收治安管理事件信息等需要处理才会上报的延迟类事件信息,采用批量方式接收城市月新增企业信息等按一定周期批量访问数据库获得的事件信息。
优选地,在接收若干个事件信息之后,根据事件来源、内容等,采用自动或者人工方式标记类型;一个事件可以标记多个类型。
优选地,当事件信息可以确定空间位置时,采用自动或者人工方式标记位置属性。
优选地,当事件信息可以确定发生地时间,需要采用自动或者人工方式标记时间属性;时间属性有事件发生的时间、进入系统的时间、被系统处理的时间等不同,需要根据业务规则来选择那种时间作为计算依据。
优选地,采用分词系统提取事件信息中关键字;每个事件信息的关键字可以有多个。
S310计算任意两个事件信息在各个维度下的距离。
具体地,距离的概念在不同维度中含义有所不同,比如在空间属性中二维平面坐标系内,两个点的距离可以是直线距离、或者同一条路上的两个点的沿路距离;在时间维度,距离则是时间差;在类型维度,距离是两个类型之间的关联系数;在属性维度,是相同关键字的数量为属性维度的距离等;用户也可以自己定义不同维度中距离的衡量标准。
S321当事件信息具有多个类别时,分别计算各个类别的子相关指数。
S322将各个类别的子相关指数的和作为事件信息总的类别维度的相关指数。
S330基于任意两个事件信息在各个维度下的相关指数,计算事件信息在不同维度下的总相关指数。
优选地,为了缩小计算范围,可以根据事件的时间、状态等做筛选和过滤,比如只和没有关闭的事件做相关性计算或只和发生在24小时内的事件做相关性计算。
优选地,对于重复事件,后续重复事件不再单独计算相关性,比如多人上报了同一个火灾的事件信息只做一次计算。
S400根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件。
S500对热点事件进行人工判别,人为筛选热点事件。
具体地,在S400根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件后,将热点事件呈现给用户。自动识别出的热点事件,有可能并非真正的热点,所以人工判别是必要的。人工判别就是根据系统展现的热点事件,人工判断事件的内容、位置、类型、以及与其他事件的关联关系等方面,判断是否为热点事件;如果是的话,即启动相应处置流程。
实施例6
本发明的一个实施例,如图5所示,在实施例1的基础上,根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件,包括步骤:
S410基于事件信息总相关指数生成有向图,当事件信息的总相关指数大于预设总相关指数阈值时,事件信息在有向图中为连接关系。
示例性地,如图6所示,可以根据事件信息A、B、C、D、E、F、G、H、I、J之间的总相关指数生成有向图,当两个事件信息的总相关指数大于5时,两个事件信息在有向图中为连接关系。
S420根据有向图中事件信息的出度识别热点事件,当有向图中事件信息出度大于预设出度阈值时,识别事件信息为热点事件,和/或,根据有向图中事件信息的出度大小排序,当事件信息的排序号在某一预设区间内时,识别事件信息为热点事件。
示例性地,如图6所示,事件信息的出度是指该事件信息所在点的出边条数,如A的出度为2,B的出度为1,C的出度为1,D的出度为3等。当出度大于等于3时,判定为热点事件,即图6中D为热点事件。
本实施例利用不同维度的距离计算出事件之间的相关指数,并以有向图的方式计算当前最热点的事件,具有实时、高效的特点。并且在不同的领域中,通过定制本领域的距离计算规则库,可以很方便适应特定领域需求,具有非常高的适应性。可以解决城市管理过程中热点事件识别、处理不及时的问题。本发明的热点事件识别方法是基于事件间相关性识别热点事件,使热点事件识别不是依据关注度而是依据逻辑关系,不依赖事件信息中关注度数据,可以在事件尚未取得更高关注度时,更早的识别和处置热点事件。
实施例7
本发明的一个实施例,如图7所示,本发明还提供一种热点事件识别系统,包括接收模块10、计算模块20、识别模块30、显示模块40、多维空间事件距离计算规则库50。
其中接收模块10,用于接收若干个事件信息,事件信息至少为两种事件信息。
具体地,在接收若干个事件信息时可以采用实时、准实时、或者批量的方式接收多个来源、多种类型的事件消息。其中,准实时接收事件信息指接收存在一定数据延迟的事件信息,批量接收事件信息指访问城市管理事件信息数据库后,统一接收事件信息。
示例性地,采用实时方式接收报警信息等非延时类事件信息,采用准实时方式接收治安管理事件信息等需要处理才会上报的延迟类事件信息,采用批量方式接收城市月新增企业信息等按一定周期批量访问数据库获得的事件信息。
优选地,在接收若干个事件信息之后,根据事件来源、内容等,采用自动或者人工方式标记类型;一个事件可以标记多个类型。
优选地,当事件信息可以确定空间位置时,采用自动或者人工方式标记位置属性。
优选地,当事件信息可以确定发生地时间,需要采用自动或者人工方式标记时间属性;时间属性有事件发生的时间、进入系统的时间、被系统处理的时间等不同,需要根据业务规则来选择那种时间作为计算依据。
优选地,采用分词系统提取事件信息中关键字;每个事件信息的关键字可以有多个。
计算模块20,与接收模块10连接,计算事件信息在不同维度下的总相关指数。
具体地,根据事件信息与多维空间事件距离计算规则库计算事件信息在各个维度的相关指数,再根据各个维度的相关指数,排除事件信息中相关指数小于预设阈值的维度;计算事件信息中剩余各个维度的相关指数乘积为事件信息在不同维度下的总相关指数。
优选地,为了缩小计算范围,可以根据事件的时间、状态等做筛选和过滤,比如只和没有关闭的事件做相关性计算或只和发生在24小时内的事件做相关性计算。
优选地,对于重复事件,后续重复事件不再单独计算相关性,比如多人上报了同一个火灾的事件信息只做一次计算。
识别模块30,根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件。
显示模块40,用于将热点事件显示给用户,通过用户对热点事件进行人工判别,人为筛选热点事件。
具体地,在识别模块30根据事件信息的总相关指数识别出各个事件信息中至少一个热点事件后,将热点事件呈现给用户。自动识别出的热点事件,有可能并非真正的热点,所以人工判别是必要的。人工判别就是根据系统展现的热点事件,人工判断事件的内容、位置、类型、以及与其他事件的关联关系等方面,判断是否为热点事件;如果是的话,即启动相应处置流程。
具体地,计算规则库用于计算事件信息在不同维度下的总相关指数,维度包括时间维度、空间维度、类别维度、属性维度。
实施例8
本发明的一个实施例,在实施例7的基础上,如图7所示,其中计算模块20还包括:距离计算单元21、换算单元22、总相关指数计算单元23。
距离计算单元21,用于计算两个不同的事件,在某一维度下,事件信息在维度下的距离。
具体地,距离的概念在不同维度中含义有所不同,比如在空间属性中二维平面坐标系内,两个点的距离可以是直线距离、或者同一条路上的两个点的沿路距离;在时间维度,距离则是时间差;在类型维度,距离是两个类型之间的关联系数;在属性维度,是相同关键字的数量为属性维度的距离等;用户也可以自己定义不同维度中距离的衡量标准。
换算单元22,用于将事件信息在该维度下的距离换算成事件信息在该维度下的相关指数。
具体地,换算单元22将任意两个事件信息在各个维度下的距离换算成任意两个事件信息在各个维度下的相关指数前,可以预先建立多维空间相关指数换算二维矩阵,相关指数换算二维矩阵用于将任意两个事件信息在各个维度下的距离换算成任意两个事件信息在各个维度下的相关指数。针对不同维度,距离计算方式不同,但是基本模型是距离越近,相关指数越高;距离越远,相关指数越低,当距离超过某个阈值时,相关指数将为最低值0。
总相关指数计算单元23,用于基于事件信息在该维度下的相关指数,计算事件信息总相关指数。
优选地,为了缩小计算范围,可以根据事件的时间、状态等做筛选和过滤,比如只和没有关闭的事件做相关性计算或只和发生在24小时内的事件做相关性计算。
优选地,对于重复事件,后续重复事件不再单独计算相关性,比如多人上报了同一个火灾的事件信息只做一次计算。
本实施例中距离计算单元21用于,计算事件信息的时间的时间差,包括事件信息起始时间差的计算、结束时间差的计算、其中一个事件信息起始时间与另一事件信息结束时间的时间差,该时间差为时间维度的距离。
计算单元21还用于计算事件信息的发生地点的距离为空间维度下的距离。
优选地,空间维度可以根据事件的空间位置类型,分为点、线、面之间距离运算,比如点与点、点与线、线与面等。
进一步优选地,空间维度距离的计算,可以跟空间对象的形态有特定关系,比如事件沿路的距离才有意义,如果离开了道路,即使直线距离很近,也视为超过最大阈值;或者发生在同一个园区内才视为有效距离,离开园区范围视为超过最大阈值,当距离超过最大阈值时相关指数为极小值0。
计算单元21还用于计算事件信息分属类别的关联系数,关联系数数值等于事件信息在类别维度的距离。
具体地,在计算任意两个事件信息在类别维度下的关联系数前,应该预先建立不同类别间的关联系数二维矩阵,通过比对两个事件之间类别,直接得出两个事件之间关联系数。
示例性的,两个事件之间关联系数可以为0,表示这两种类型间没有相关性;关联系数越高表示越相关,最高为10。火灾类型与急救类型之间距离为8,交通事故类型与交通拥堵类型之间距离为9,火灾类型与交通拥堵类型之间距离为5,交通拥堵类型与城市卫生类型之间距离为0。事件可以有多个类型,两个事件之间多个类型的相关系数的和即为两个事件之间的类型相关系数;如果累加值大于10,则取10为最终值。
计算单元21还用于计算所述事件信息相同关键字的数量,相同关键字数量为属性维度的距离,属性维度的距离的最低为0;最高为10;如果两个事件间的相同关键字超过10,则取10为最大值。。
具体地,在属性维度是根据事件的内容,采用分词的方式提取关键字。
计算单元21可以采用同时计算一种或多种该事件信息在各个维度下距离。
示例性地,计算单元21可以只计算两个事件的时间差,也可以同时计算两个事件的时间差与关联系数。
总相关指数计算单元23,用于排除掉相关指数小于预设阈值的维度后,计算事件信息中剩余各个维度的相关指数乘积为事件信息在不同维度下的总相关指数。
示例性地,相关指数最小值为0,表示不相关;最大值为10。两个事件总的相关指数是这两个事件在各维度相关指数的乘积,为了避免0值的干扰,计算乘积时需要将小于预设阈值的维度去掉。预设阈值可以设置为1。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详细描述或记载的部分,可以参见其他实施例的相关描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
在本申请所提供的实施例中,应该理解到,所揭露的热点事件识别方法和系统,可以通过其他的方式实现。例如,以上所描述的热点事件识别方法和系统实施例仅仅是示意性的,例如,所述模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接或集成电路,可以是电性、机械或其他的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可能集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
应当说明的是,上述实施例均可根据需要自由组合。以上所述仅是本发明的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本发明的保护范围。

Claims (10)

1.一种热点事件识别方法,其特征在于,包括步骤:
接收若干个事件信息;
计算所述事件信息在不同维度下的总相关指数;
根据所述事件信息的总相关指数识别出各个所述事件信息中至少一个热点事件;
对所述热点事件进行人工判别,人为筛选所述热点事件。
2.根据权利要求1所述的一种热点事件识别方法,其特征在于,在所述接收若干个事件信息前,还包括:
预先建立多维空间事件距离计算规则库,所述计算规则库用于计算所述事件信息在不同维度下的总相关指数,所述维度包括时间维度、空间维度、类别维度、属性维度。
3.根据权利要求1~2中任意一项所述的一种热点事件识别方法,其特征在于,所述计算所述事件信息在不同维度下的总相关指数,包括:
计算任意两个所述事件信息在各个维度下的距离;
将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数;
基于任意两个所述事件信息在各个维度下的相关指数,计算任意两个所述事件信息在不同维度下的总相关指数。
4.根据权利要求3所述的一种热点事件识别方法,其特征在于,所述计算任意两个所述事件信息在各个维度下的距离,包括:
计算任意两个所述事件信息在时间维度下的起始时间差、结束时间差,以及一个事件信息起始时间与另一事件信息结束时间的时间差,所述时间差为任意两个所述事件信息在时间维度的距离;
和/或计算任意两个所述事件信息在空间维度下的距离,所述距离为任意两个所述事件信息在空间维度下的距离;
和/或计算任意两个所述事件信息在类别维度下的关联系数,所述关联系数为任意两个所述事件信息在类别维度下的距离,所述关联系数由不同类别间的预设的关联系数二维矩阵获得;
和/或计算任意两个所述事件信息在属性维度下的相同关键字的数量,所述相同关键字数量为任意两个所述事件信息在属性维度的距离。
5.根据权利要求3所述的一种热点事件识别方法,其特征在于,在将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数前,还包括:
预先建立多维空间距离与相关指数换算的换算二维矩阵,所述换算二维矩阵用于将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数。
6.根据权利要求3所述的一种热点事件识别方法,其特征在于,计算任意两个所述事件信息在不同维度下的总相关指数,包括步骤:
排除所述事件信息中相关指数小于预设阈值的维度;
计算所述事件信息中剩余各个维度的相关指数乘积为所述事件信息在不同维度下的总相关指数。
7.根据权利要求3所述的一种热点事件识别方法,其特征在于,所述将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数,还包括步骤:
若所述事件信息具有多个类别,则分别计算各个类别的子相关指数;
将各个类别的子相关指数的和作为所述事件信息总的类别维度的相关指数。
8.根据权利要求1所述的一种热点事件识别方法,其特征在于,所述根据所述事件信息的总相关指数识别出各个所述事件信息中至少一个热点事件,包括步骤:
基于所述事件信息总相关指数生成有向图,当所述事件信息的总相关指数大于预设总相关指数阈值时,所述事件信息在有向图中为连接关系;
根据所述有向图中事件信息的出度识别热点事件,当所述有向图中所述事件信息出度大于预设出度阈值时,识别所述事件信息为热点事件,和/或,根据所述有向图中事件信息的出度大小排序,当所述事件信息的排序号在某一预设区间内时,识别所述事件信息为热点事件。
9.一种热点事件识别系统,其特征在于,包括:
接收模块,用于接收若干个事件信息;
计算模块,与所述接收模块连接,计算所述事件信息在不同维度下的总相关指数;
识别模块,根据所述事件信息的总相关指数识别出各个所述事件信息中至少一个热点事件;
显示模块,用于将所述热点事件显示给用户,通过用户对所述热点事件进行人工判别,人为筛选所述热点事件;
多维空间事件距离计算规则库,所述计算规则库中储存有计算所述事件信息在不同维度下的总相关指数的规则,所述不同维度包括时间维度、空间维度、类别维度、属性维度。
10.根据权利要求9所述的一种热点事件识别系统,其特征在于,所述计算模块,包括:
距离计算单元,用于计算任意两个所述事件信息在各个维度下的距离;
换算单元,用于将任意两个所述事件信息在各个维度下的距离换算成任意两个所述事件信息在各个维度下的相关指数;
总相关指数计算单元,用于基于任意两个所述事件信息在各个维度下的相关指数,计算任意两个所述事件信息在不同维度下的总相关指数;
所述距离计算单元用于计算任意两个所述事件信息在时间维度下的起始时间差、结束时间差,以及一个事件信息起始时间与另一事件信息结束时间的时间差,所述时间差为任意两个所述事件信息在时间维度的距离;
和/或计算任意两个所述事件信息在空间维度下的距离,所述距离为任意两个所述事件信息在空间维度下的距离;
和/或计算任意两个所述事件信息在类别维度下的关联系数,所述关联系数为任意两个所述事件信息在类别维度下的距离,所述关联系数由不同类别间的预设的关联系数二维矩阵获得;
和/或计算任意两个所述事件信息在属性维度下的相同关键字的数量,所述相同关键字数量为任意两个所述事件信息在属性维度的距离;
所述换算单元中包括多维空间距离与相关指数换算的换算二维矩阵;
所述总相关指数计算单元用于排除所述事件信息中相关指数小于预设阈值的维度,计算所述事件信息中剩余各个维度的相关指数乘积为所述事件信息在不同维度下的总相关指数。
CN202110894868.0A 2021-08-05 2021-08-05 一种热点事件识别方法和系统 Pending CN113590978A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110894868.0A CN113590978A (zh) 2021-08-05 2021-08-05 一种热点事件识别方法和系统

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110894868.0A CN113590978A (zh) 2021-08-05 2021-08-05 一种热点事件识别方法和系统

Publications (1)

Publication Number Publication Date
CN113590978A true CN113590978A (zh) 2021-11-02

Family

ID=78255417

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110894868.0A Pending CN113590978A (zh) 2021-08-05 2021-08-05 一种热点事件识别方法和系统

Country Status (1)

Country Link
CN (1) CN113590978A (zh)

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489036A (zh) * 2013-09-27 2014-01-01 上海交通大学 基于混合空间关联分析的应急预警网格划分系统及方法
CN107229712A (zh) * 2017-05-27 2017-10-03 中南大学 一种面向公共安全事件信息获取的时空聚类方法
CN111581396A (zh) * 2020-05-06 2020-08-25 西安交通大学 一种基于多维特征融合与依存句法的事件图谱构建系统及方法
CN112199585A (zh) * 2020-09-29 2021-01-08 黑龙江省网络空间研究中心 一种基于数据挖掘技术的网络舆情突发热点事件发现方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103489036A (zh) * 2013-09-27 2014-01-01 上海交通大学 基于混合空间关联分析的应急预警网格划分系统及方法
CN107229712A (zh) * 2017-05-27 2017-10-03 中南大学 一种面向公共安全事件信息获取的时空聚类方法
CN111581396A (zh) * 2020-05-06 2020-08-25 西安交通大学 一种基于多维特征融合与依存句法的事件图谱构建系统及方法
CN112199585A (zh) * 2020-09-29 2021-01-08 黑龙江省网络空间研究中心 一种基于数据挖掘技术的网络舆情突发热点事件发现方法

Similar Documents

Publication Publication Date Title
CN107168854B (zh) 互联网广告异常点击检测方法、装置、设备及可读存储介质
CN105550756B (zh) 一种基于模拟车辆受损的汽车快速定损方法
TWI772673B (zh) 行業識別模型確定方法和裝置
CN114722974B (zh) 基于事理逻辑和实体知识的多维度图谱融合方法
CN110909129B (zh) 异常投诉事件的识别方法及装置
CN114881508A (zh) 一种电网指标报表的数据处理方法、装置及设备
CN113807622A (zh) 一种事件决策生成方法、装置、电子设备及存储介质
CN112925899B (zh) 排序模型建立方法、案件线索推荐方法、装置及介质
CN112464818B (zh) 后厨监管方法、装置、设备及存储介质
CN106155000B (zh) 半导体机台的机台警报信息的处理方法及装置
JP7082688B2 (ja) データ処理方法、装置、及び記憶媒体
CN113590978A (zh) 一种热点事件识别方法和系统
CN110502521B (zh) 一种档案库的建立方法
CN106815772A (zh) 电力数据上报方法及装置
CN115423361A (zh) 风险视图的数据处理方法、装置、存储介质和设备
CN115049089A (zh) 一种基于物联网的智慧物业管理系统及方法
CN114881533A (zh) 基于大数据的装修辅助系统
CN114241206A (zh) 目标对象的特征提取方法、装置、电子设备及存储介质
CN110428627B (zh) 一种公交出行潜力区域识别方法及识别系统
CN113344642A (zh) 用于预测广告投资回报率的方法、装置、电子设备及可读存储介质
CN109391738B (zh) 一种根据移动终端信息进行预警的方法
CN113313615A (zh) 一种对企业司法风险进行量化评分定级的方法及装置
CN111159506A (zh) 一种数据有效性识别方法、装置、设备及可读存储介质
CN112446673A (zh) 一种商标变更判断方法、系统、设备及可读存储介质
CN117573726B (zh) 一种基于大数据的订单信息智能搜索方法

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination