CN112307360A - 基于搜索引擎的区域性事件检测方法、装置和搜索引擎 - Google Patents
基于搜索引擎的区域性事件检测方法、装置和搜索引擎 Download PDFInfo
- Publication number
- CN112307360A CN112307360A CN201910696186.1A CN201910696186A CN112307360A CN 112307360 A CN112307360 A CN 112307360A CN 201910696186 A CN201910696186 A CN 201910696186A CN 112307360 A CN112307360 A CN 112307360A
- Authority
- CN
- China
- Prior art keywords
- search
- regional
- time
- event
- regional event
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001514 detection method Methods 0.000 title claims abstract description 141
- 238000000034 method Methods 0.000 claims abstract description 36
- 230000007774 longterm Effects 0.000 claims description 20
- 238000004590 computer program Methods 0.000 claims description 7
- 238000012544 monitoring process Methods 0.000 abstract description 18
- 230000000875 corresponding effect Effects 0.000 description 26
- 238000010276 construction Methods 0.000 description 14
- 238000010586 diagram Methods 0.000 description 14
- 238000004422 calculation algorithm Methods 0.000 description 9
- 230000008569 process Effects 0.000 description 7
- 238000005516 engineering process Methods 0.000 description 6
- 230000006870 function Effects 0.000 description 6
- 230000001066 destructive effect Effects 0.000 description 4
- 238000010801 machine learning Methods 0.000 description 4
- 238000004458 analytical method Methods 0.000 description 3
- 230000006399 behavior Effects 0.000 description 2
- 239000000463 material Substances 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000002159 abnormal effect Effects 0.000 description 1
- 230000004075 alteration Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000013523 data management Methods 0.000 description 1
- 238000000586 desensitisation Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 230000004069 differentiation Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011897 real-time detection Methods 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/907—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/909—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9537—Spatial or temporal dependent retrieval, e.g. spatiotemporal queries
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/903—Querying
- G06F16/9035—Filtering based on additional data, e.g. user or group profiles
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/906—Clustering; Classification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/90—Details of database functions independent of the retrieved data types
- G06F16/95—Retrieval from the web
- G06F16/953—Querying, e.g. by the use of web search engines
- G06F16/9538—Presentation of query results
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Engineering & Computer Science (AREA)
- Databases & Information Systems (AREA)
- Theoretical Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Computational Linguistics (AREA)
- Library & Information Science (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请公开了一种基于搜索引擎的区域性事件检测方法、装置、搜索引擎、计算机设备和存储介质。其中方法包括:基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据;根据与区域性事件相关的关键搜索数据进行区域性事件检测;在检测到区域性事件时,根据与区域性事件相关的关键搜索数据的地域分布,对检测到的区域性事件进行位置估计。该方法使用搜索引擎的实时搜索数据进行区域性事件检测可以反映人们对区域性事件的感受,这种检测方式与传统的依靠物理监测设备来检测区域性事件而言,扩大了监测范围。
Description
技术领域
本申请涉及搜索引擎技术领域,尤其涉及一种基于搜索引擎的区域性事件检测方法、装置、搜索引擎、计算机设备和计算机可读存储介质。
背景技术
相关技术中,实时地震检测及地震快速播报技术目前普遍采用如下步骤来解决:1)建设大规模的地震台网监测震动信号,这是一般地震检测的第一步也是地震监测的基础设施;2)对第一步收集来的信号进行识别,及时发现地震的发生并测量地震烈度等一系列地震信息;这一步通常使用各种时间序列异常检测算法或模板匹配算法完成;3)检测到地震后根据预定标准(如地震烈度达到3级)向民众发布,一般发布通过专用APP或各种社交媒体完成。
但是,上述三个步骤都有相应的不足:步骤1)地震台网的建设需要大量的资金,缺乏建设条件或未能建设台网的地方就无法进行地震的监测,监测范围受限较大;步骤2)使用地震波信号进行地震检测无法反映人们对地震的感受;步骤3)在向群众发布地震信息时,无法做到根据群众对地震信息的需求发布;从发布信息的渠道来看,传统通过媒体,APP(应用程序)发布的方式不够及时,普及程度也不够高,而且缺乏针对性。
发明内容
本申请的目的旨在至少在一定程度上解决上述的技术问题之一。
为此,本申请的第一个目的在于提出一种基于搜索引擎的区域性事件检测方法。该方法使用搜索引擎的实时搜索数据进行区域性事件检测可以反映人们对区域性事件的感受,这种检测方式与传统的依靠物理监测设备来检测区域性事件而言,扩大了监测范围。
本申请的第二个目的在提出一种基于搜索引擎的区域性事件检测装置。
本申请的第三个目的在于提出一种搜索引擎。
本申请的第四个目的在于提出一种计算机设备。
本申请的第五个目的在于提出一种计算机可读存储介质。
为达到上述目的,本申请第一方面实施例提出的基于搜索引擎的区域性事件检测方法,包括:基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据;根据所述与区域性事件相关的关键搜索数据进行区域性事件检测;在检测到区域性事件时,根据所述与区域性事件相关的关键搜索数据的地域分布,对所述检测到的区域性事件进行位置估计。
为达到上述目的,本申请第二方面实施例提出的基于搜索引擎的区域性事件检测装置,包括:搜索数据获取模块,用于基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据;事件检测模块,用于根据所述与区域性事件相关的关键搜索数据进行区域性事件检测;位置估计模块,用于在检测到区域性事件时,根据所述与区域性事件相关的关键搜索数据的地域分布,对所述检测到的区域性事件进行位置估计。
为达到上述目的,本申请第三方面实施例提出的搜索引擎,包括:本申请第二方面实施例所述的基于搜索引擎的区域性事件检测装置。
为达到上述目的,本申请第四方面实施例提出的计算机设备,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行时,实现本申请第一方面实施例所述的基于搜索引擎的区域性事件检测方法。
为达到上述目的,本申请第五方面实施例提出的计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请第一方面实施例所述的基于搜索引擎的区域性事件检测方法。
根据本申请实施例的基于搜索引擎的区域性事件检测方法、装置、搜索引擎、计算机设备和存储介质,基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据,并根据与区域性事件相关的关键搜索数据进行区域性事件检测,在检测到区域性事件时,根据与区域性事件相关的关键搜索数据的地域分布,对检测到的区域性事件进行位置估计。即基于搜索引擎中的搜索数据实现区域性事件的检测,使用搜索引擎的实时搜索数据进行区域性事件检测可以反映人们对区域性事件(如地震)的感受,实现可能发生区域性事件的位置估计,能够在没有物理区域性事件检测设备(如物理地震台网)的地方使用,只要有网络有用户基于搜索引擎进行搜索就可进行区域性事件监测,这种检测方式不受物理监测设备的建设条件、建设地区以及建设所需资金等因素的影响,与传统的依靠物理监测设备来检测区域性事件而言,扩大了监测范围。
本申请附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本申请的实践了解到。
附图说明
本申请的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
图1是根据本申请一个实施例的基于搜索引擎的区域性事件检测方法的流程图;
图2是根据本申请实施例的基于搜索引擎的区域性事件检测方法的流程图;
图3是根据本申请实施例的时间序列的示例图;
图4是根据本申请一个具体实施例的基于搜索引擎的区域性事件检测方法的流程图;
图5是根据本申请另一个具体实施例的基于搜索引擎的区域性事件检测方法的流程图;
图6是根据本申请实施例的基于搜索引擎的区域性事件检测方法的流程图;
图7是根据本申请一个实施例的基于搜索引擎的区域性事件检测装置的结构示意图;
图8是根据本申请一个具体实施例的基于搜索引擎的区域性事件检测装置的结构示意图;
图9是根据本申请另一个具体实施例的基于搜索引擎的区域性事件检测装置的结构示意图;
图10是根据本申请一个实施例的计算机设备的结构示意图。
具体实施方式
下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
需要说明的是,实时地震检测(Real-time EarthquakeDetection)及地震快速播报(EarthquakeRapid Reporting)技术是指对由地震引发的各种变化进行实时识别,从而及时判断是否有地震发生并向群众发布预警消息的技术。在当今的抗震救灾中,地震的及时检测和快速播报十分关键,可以使群众及时的了解震情,做出应对,也能为相关部门的震后紧急管理提供指导信息。即使没有发生有破坏性的地震,如果群众感受到了地面的震动,会想要了解是否发生了地震,及时的信息发布可以消除恐慌和谣言。相关技术中,通过地震台网对地震波的信号进行物理监测,识别信号中的地震波形然后根据预定标准(如地震烈度达到3级)向民众发布。由于是通过地震波进行的监控,可以了解真实准确的地震情况,但是无法了解群众对地震的感受,难以及时准确的向关心地震信息的群众发布消息。有些地震烈度虽然小于3级但是群众有感,这时也需要对地震进行发布,有些时候并非是地震导致的震动,人们误以为发生了地震,这时也应当及时发布安全信息。
为了解决上述技术问题,发明人通过对搜索数据的分析发现在区域性事件发生之后,与区域性事件等关键词有关的搜索会在短时间内迅速爆发,这说明当人们在体感上或视觉上感受到环境出现异常(如感受到震感)后会迅速在互联网上寻求是否发生区域性事件的最新消息,而这时一般传统的速报信息(如传统的官方网站的速报信息)都还没有发布。这种对信息的搜寻行为体现了群众对快速得到地震相关消息的需求,也可以利用搜索数据进行区域性事件检测。为此,本申请提出了一种基于搜索引擎的实时区域性事件检测方法及区域性事件快速播报技术,使用了互联网搜索引擎的实时搜索数据进行实时区域性事件检测,并通过搜索引擎进行事件检测结果及时反馈和发布。具体地,下面参考附图描述本申请实施例的基于搜索引擎的区域性事件检测方法、装置、搜索引擎、计算机设备和计算机可读存储介质。
图1是根据本申请一个实施例的基于搜索引擎的区域性事件检测方法的流程图。需要说明的是,本申请实施例的基于搜索引擎的区域性事件检测方法可应用于本申请实施例的基于搜索引擎的区域性事件检测装置,该装置可被配置于计算机设备上,作为一种示例,该计算机设备可为搜索引擎,以实现内容搜索功能。如图1所示,该基于搜索引擎的区域性事件检测方法可以包括:
步骤110,基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据。
其中,在本申请的一个实施例中,该搜索数据可包括搜索内容、搜索时间和搜索地点等信息。具体地,首先需要对搜索引擎的搜索数据进行储存,本申请可使用集群进行大规模数据的管理。在进行事件分析检测前,需对数据进行脱敏,以去除搜索数据中的个人信息进行数据脱敏,仅保留搜索内容,搜索时间和搜索地点等信息。
可以理解,由于储存的搜索数据包含众多与区域性事件无关的搜索,需要将其中与区域性事件发生最为紧密的搜索筛选出来,以得到与区域性事件相关的关键搜索数据。作为一种示例,可基于搜索数据中的搜索内容,从搜索引擎的搜索数据中,选取包含预设关键字的目标搜索数据,并根据目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,以计算每种搜索与突发区域性事件的关联程度,并根据所述每种搜索与突发区域性事件的关联程度,从所述目标搜索数据中选取所述与区域性事件相关的关键搜索数据。
可选地,根据所述目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,得到每种搜索在发生区域性事件前的平均搜索频率和在发生区域性事件后的平均搜索频率,并根据每种搜索在发生区域性事件前的平均搜索频率和在发生区域性事件后的平均搜索频率,计算每种搜索与突发区域性事件的关联程度,之后,根据每种搜索与突发区域性事件的关联程度,从目标搜索数据中选取与区域性事件相关的关键搜索数据。
举例而言,以区域性事件为地震事件为例,可从历史搜索数据中将包含“地震”关键字的相关搜索挑选出来,然后根据这段时间内的地震目录对地震前后一段时间之内每种搜索的数量进行统计,可以得到每种搜索的地震前后平均搜索频率:Freqpre,Freqpost。依据这两个历史统计频率,可以计算反映搜索与突发事件关联程度的指标,突发事件发生后,频率的增长越大,相关搜索越多,指标越高。一种搜索的这个指标越高说明在事件发生后这种搜索的增长越显著,与时间的发生关联越紧密。本申请可使用这个指标挑选了数种搜索(例如:“地震”,“地震最新消息”,“地震网”,“刚刚地震了”,“地震最新消息今天”,“中国地震台网”,“中国地震网”,“刚才哪里地震了”等)作为用于监测地震所关注的搜索内容。这样,之后在实时检测中就只需从实时的搜索数据中提取这些关键内容的搜索,可以过滤掉无关信息,也可以提高效率。
步骤120,根据与区域性事件相关的关键搜索数据进行区域性事件检测。
在本步骤中,基于所述与区域性事件相关的关键搜索数据,可使用一种时间序列异常检测算法用来检测搜索数据中突发事件,例如,可为搜索数据设计了一种两阶段的异常检测算法,第一阶段为统计异常检测,第二阶段为机器学习方法,这两个阶段的方法可以自由选取,为了方便本领域技术人员对本申请的理解,下面将给出一种方法应用的样例,其中基于统计的异常检测部分可以使用我们设计的多间隔微分检测,机器学习部分可以使用随机森林分类算法,需要说明的是,该示例仅是为了帮助本领域技术人员对本申请的理解,并不能作为是对本申请的具体限定。
可选地,通过上述时间序列异常检测算法检测所述关键搜索数据中突发事件的具体实现过程可如下:根据所述关键搜索数据中的搜索内容和搜索时间,将所述关键搜索数据转化为时间序列,其中,所述时间序列用于表示关键搜索数据的搜索频率随时间变化,所述时间序列包括多个时间点和每个时间点所对应的关键搜索数据的搜索频率;之后,可根据该时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,检测是否有区域性事件发生。
例如,在通过上述时间序列异常检测算法中第一阶段的多间隔微分检测方法,基于所述关键搜索数据中的搜索内容和搜索时间,将所述关键搜索数据转化为其搜索频率随时间变化的时间序列Sδ:
Sδ={{t1,f1},{t2,f2},...,{tnδ,fnδ}}
tn=t0+n·δ
其中,t为时间戳;δ为时间戳之间的间隔;f为t时间对应的关键搜索数据的搜索频率,即fn是tn-1到tn之间关键搜索数据的搜索频率;t0为初始时间,n为时间戳个数。
在得到所述关键搜索数据所对应的时间序列之后,可基于该时间序列计算其多间隔微分序列,基于该多间隔微分序列来捕获有突发事件发生的时间点,进而利用机器学习算法对捕获的时间点进行进一步的分类,以检测是否有区域性事件发生。作为一种示例,如图2所示,所述根据时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,检测是否有区域性事件发生的具体实现过程可包括:
步骤210,选取多个微分时间间隔。
步骤220,根据所述多个微分时间间隔、所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,计算所述每个时间点的多间隔微分序列值。
可选地,在得到所述关键搜索数据的时间序列之后,可根据时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,采用以下公式(1),来计算该时间序列所对应的多间隔微分序列D={Dint}int∈I,从而可以得到所述每个时间点的多间隔微分序列值。
其中,int为计算微分时的时间间隔;D为微分序列;I为多间隔的间隔时间集合;interval为间隔时间;dint为int时间间隔下f的微分值;n为时间戳个数。
举例而言,以得到的时间序列为如图3所示的时间序列S为例,其中,t1=t0+1·δ,t2=t0+2·δ,t3=t0+3·δ,t4=t0+4·δ,t5=t0+5·δ,t6=t0+6·δ,f0至f6分别为t0至t6时间戳所对应的关键搜索数据的搜索频率;假设选取两个微分时间间隔,如间隔1和间隔2,针对间隔1,根据如图3所示的时间序列S中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,计算间隔1的微分时间序列D1;针对间隔2,根据如图3所示的时间序列S中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,计算间隔2的微分时间序列D2,如图3所示,这样,可将一个时序列处理为两条多间隔微分时间序列。其中,在计算每条多间隔微分时间序列中的每个微分值时,可基于微分时间间隔、时间序列S中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率进行计算。例如,以计算间隔1的微分时间序列D1中的微分值为例,可利用时间序列S中时间戳t1的搜索频率f1减去时间戳t0的搜索频率f0而得到,即以此类推可得到其他微分值,进而可得到每个时间点的多间隔微分序列值。
步骤230,根据所述每个时间点的多间隔微分序列值,确定检测到有区域性事件发生的检测时间点。
在本步骤中,可采用不同阈值的短时平均值/长时平均值(STA/LTA)方法应用于每个间隔的微分序列,当在一个时间点进行检测,所有序列都触发阈值时,即可捕捉到有突发事件发生,这种方法具有快速,准确,误报率低的特点。作为一种示例,针对所述每个时间点,可根据所述每个时间点的多间隔微分序列值计算每个间隔的短时平均值和长时平均值,并根据所述每个间隔的短时平均值和长时平均值,计算所述每个间隔的短时平均值与长时平均值的比值,当判断在一个时间点之前的最大微分时间间隔的时间内,所述每个间隔的比值均大于所述每个间隔的预设阈值时,检测到有区域性事件发生,并将所述一个时间点确定为所述检测到有事件发生的检测时间点,而此所述时间点减去最大微分时间间隔得到的时间点即为检测到的事件发生时间。
也就是说,每条多间隔微分时间序列都有一个阈值,该阈值可以是预先设定的;这个阈值可以是用来判断短时平均值与长时平均值的比值是否超过这个值,如果所有时间间隔下都超过就认为有突发事件发生。其中,该短时平均值就是微分值在较短时间内(如2分钟)的平均值,长时平均值就是相对短时平均值的较长时间内的平均值。例如,以如图3所示的示例为例,可预先设置这两条间隔微分时间序列都对应一个阈值,基于每条间隔微分时间序列中的各微分值,计算该间隔下的短时平均值与长时平均值的比值,判断每个间隔下的短时平均值与长时平均值的比值是否均超过对应间隔下的阈值,若有一个时间点的所有间隔下的短时平均值与长时平均值的比值均超过对应间隔下的阈值,则捕获到有区域性事件发生,并将这两个间隔所属的时间点作为所述检测到有事件发生的检测时间点。
举例而言,假设选取多个微分时间间隔{1,2,,…,m}(可以理解为间隔1分钟、间隔2分钟、…、间隔m分钟,或间隔0.5分钟、间隔1分钟、…、间隔m*0.5分钟),则在tn时刻进行检测时,短时平均值/长时平均值(STA/LTA)方法应用于每个间隔的微分序列可以得到对应的长短时比值序列:其中,表示tn时刻的rm值(即间隔m的微分序列的长短时比值),表示tn-m+2时刻的r2值(即间隔2的微分序列的长短时比值),表示tn-m+1时刻的r1值(即间隔1的微分序列的长短时比值);若该长短时比值序列中的每个值均大于对应的预设阈值,则检测到有事件发生,其中,tn即为所述检测到有事件发生的检测时间点,而tn-m即为检测到的事件的发生时间。
步骤240,选取所述检测时间点前第二预设时间的关键搜索数据的搜索频率作为事件分类特征。
需要说明的是,本步骤中的搜索频率可以分搜索内容进行统计,这样会包含更丰富的信息。也就是说,可选取所述检测时间点前一段时间的各种关键搜索内容的搜索频率,并作为事件分类特征。
步骤250,根据所述选取的事件分类特征,检测是否有区域性事件发生。
例如,可采用机器学习进行分类。作为一种示例,可将所述选取的事件分类特征输入至预先训练好的分类器中进行预测,以检测该事件分类特征所对应的事件是否为区域性事件,从而确定是否区域性事件发生。
由此,通过上述步骤210-步骤250即可基于关键搜索数据的搜索频率随时间变化的特性,检测是否有区域性事件发生。
步骤130,在检测到区域性事件时,根据与区域性事件相关的关键搜索数据的地域分布,对检测到的区域性事件进行位置估计。
需要说明的是,关键搜索数据中可包括搜索地点。该搜索地点可理解是用户在使用搜索引擎进行搜索时,搜索引擎获取该用户当前进行搜索时所处的当前地理位置,并将该当前地理位置作为该搜索数据的搜索地点。利用该特征,在本申请的实施例中,在检测到有区域性事件时,可根据所述区域性事件发生短时间内关键搜索数据的地域分布,估计出哪里的人们最关心这个事件,从而得到该区域性事件影响大的地区,从而实现对测到的区域性事件的位置估计,这有利于区域性事件信息的发布。
根据本申请实施例的基于搜索引擎的区域性事件检测方法,基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据,并根据与区域性事件相关的关键搜索数据进行区域性事件检测,在检测到区域性事件时,根据与区域性事件相关的关键搜索数据的地域分布,对检测到的区域性事件进行位置估计。即基于搜索引擎中的搜索数据实现区域性事件的检测,使用搜索引擎的实时搜索数据进行区域性事件检测可以反映人们对区域性事件的感受,实现可能发生区域性事件的位置估计,能够在没有物理区域性事件检测设备(如物理地震台网)的地方使用,只要有网络有用户基于搜索引擎进行搜索就可进行区域性事件监测,这种检测方式不受物理监测设备的建设条件、建设地区以及建设所需资金等因素的影响,与传统的依靠物理监测设备来检测区域性事件而言,扩大了监测范围。
图4是根据本申请一个具体实施例的基于搜索引擎的区域性事件检测方法的流程图。为了能够及时地满足用户的信息需求,在检测到有区域性事件发生时,可进行区域性事件发生信息的快速播放。具体地,如图4所示,该基于搜索引擎的区域性事件检测方法可以包括:
步骤410,基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据。
步骤420,根据与区域性事件相关的关键搜索数据进行区域性事件检测。
步骤430,在检测到区域性事件时,根据与区域性事件相关的关键搜索数据的地域分布,对检测到的区域性事件进行位置估计。
需要说明的是,在本申请的实施例中,步骤410-步骤430的具体实现过程可参见上述步骤110-步骤130的具体实现过程的描述,在此不再赘述。
步骤440,获取检测到的区域性事件的发生时间。
作为一种示例,可根据所述检测到有事件发生的检测时间点和选取的多个微分时间间隔,确定出所述区域性事件的发生时间。例如,可从所述多个微分时间间隔中确定出最大微分时间间隔,并利用所述检测时间点减去所述最大微分时间间隔即可得到所述区域性事件的发生时间。
步骤450,基于搜索引擎,将检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户。
例如,当一位用户感受到有区域性事件发生,比如感受到震动,在搜索引擎进行区域性事件相关的搜索时,如在搜索引擎中输入包含与区域性事件相关关键词的搜索内容进行搜索时,如果和该用户同地区的许多其他用户也在进行区域性事件相关的搜索,则基于本申请实施例的检测方法即可检测出可能有区域性事件发生,可直接在搜索结果中将这个可能反馈给用户,及时满足用户的信息需求。
为了进一步提升用户体验,可针对性的发布区域性事件信息,还可以根据与区域性事件监管中心服务器发布的信息的比对结果及时发布安全信息避免地谣言。作为一种示例,获取区域性事件监管中心服务器发布的区域性事件速报信息,并根据所述区域性事件速报信息、所述检测到的区域性事件的发生时间和位置估计,判断是否真的有区域性事件发生,若是,则基于所述搜索引擎,将所述检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户;若否,则基于所述搜索引擎,生成安全信息,并将所述安全信息作为搜索结果反馈给所述进行搜索的用户。
也就是说,在基于搜索引擎的搜索数据检测到有区域性事件发生时,可将该检测到的区域性事件的发生时间和位置估计,与区域性事件监管中心服务器发布的区域性事件速报信息进行对比,以判断是否真的有区域性事件发生,如果真的有区域性事件发生,则基于所述搜索引擎,将所述检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户;如果没有区域性事件发生,则生成安全信息,并基于搜索引擎所述安全信息作为搜索结果反馈给所述进行搜索的用户,以让群众不要惊慌,没有破坏性区域性事件发生,这样就可以有针对性的,及时准确的发布区域性事件消息,最快的满足了用户的信息需求。
根据本申请实施例的基于搜索引擎的区域性事件检测方法,在基于搜索引擎的搜索数据检测到有区域性事件发生时,可基于搜索引擎将检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户,能够及时根据人们对区域性事件信息的诉求进行区域性事件信息的速报,及时地满足用户的信息需求,提升了用户使用体验。
需要说明的是,在本申请的实施例中,所述区域性事件可包括自然灾害、社会事件等。作为一种示例,本申请实施例的基于搜索引擎的区域性事件检测方法可应用于多种自然灾害事件的检测,例如,地震事件检测、海啸事件检测、台风事件检测、火山喷发事件检测等。下面将以本申请实施例的基于搜索引擎的区域性事件检测方法应用于地震事件检测场景为例进行描述。
可以理解,发明人通过对搜索数据的分析发现在地震发生之后,与“地震”关键词有关的搜索会在短时间内迅速爆发,这说明当人们感受到震感后会迅速在网上寻求地震的最新消息,而这时一般传统的速报信息都还没有发布。这种对信息的搜寻行为不仅体现了群众对快速得到地震相关消息的需求,也可以利用搜索数据进行地震检测。
本申请实施例的与传统的基于地震波信号的地震检测方法的区别在于,本申请使用了互联网搜索引擎的实时搜索数据进行实时地震检测,并且还设计专门适用于搜索数据的地震事件检测算法,之后在地震速报时同样使用搜索引擎进行信息的及时反馈和发布。图5是根据本申请另一个具体实施例的基于搜索引擎的区域性事件检测方法的流程图。需要说明的是,在本申请实施例中,以区域性事件为地震事件为例进行描述。如图5所示,该基于搜索引擎的区域性事件检测方法可以包括:
步骤510,基于搜索引擎的搜索数据,获取与地震相关的关键搜索数据。
其中,在本申请的一个实施例中,该搜索数据可包括搜索内容、搜索时间和搜索地点等信息。
可以理解,由于储存的搜索数据包含众多与地震事件无关的搜索,需要将其中与地震发生最为紧密的搜索筛选出来,以得到与地震相关的关键搜索数据。作为一种示例,基于搜索数据中的搜索内容,从搜索引擎的搜索数据中,选取包含预设关键字的目标搜索数据,并根据目标搜索数据中的搜索内容和搜索时间,对在发生地震前后第一预设时间段之内每种搜索的数量进行统计,得到每种搜索在发生地震前的平均搜索频率和在发生地震后的平均搜索频率,并根据每种搜索在发生地震前的平均搜索频率和在发生地震后的平均搜索频率,计算每种搜索与突发地震事件的关联程度,之后,根据每种搜索与突发地震事件的关联程度,从目标搜索数据中选取与地震相关的关键搜索数据。
步骤520,根据与地震相关的关键搜索数据进行地震事件检测。
可选地,根据所述关键搜索数据中的搜索内容和搜索时间,将所述关键搜索数据转化为时间序列,其中,所述时间序列用于表示关键搜索数据的搜索频率随时间变化,所述时间序列包括多个时间点和每个时间点所对应的关键搜索数据的搜索频率;之后,可根据该时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,检测是否有地震事件发生。作为一种示例,以该搜索数据可包括搜索内容和搜索时间为例,如图6所示,所述根据时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,检测是否有地震事件发生的具体实现过程可包括:
步骤610,选取多个微分时间间隔。
步骤620,根据所述多个微分时间间隔、所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,计算所述每个时间点的多间隔微分序列值。
步骤630,根据所述每个时间点的多间隔微分序列值,确定检测到有地震事件发生的检测时间点。
作为一种示例,可针对所述每个时间点,根据所述每个时间点的多间隔微分序列值计算每个间隔的短时平均值和长时平均值;根据所述每个间隔的短时平均值和长时平均值,计算所述每个间隔的短时平均值与长时平均值的比值;当判断在一个时间点之前最大微分时间间隔的时间内,所述每个间隔的比值均大于所述每个间隔的预设阈值时,检测到有地震事件发生,并将所述一个时间点确定为所述检测到有地震事件发生的检测时间点。
步骤640,选取所述检测时间点前第二预设时间的关键搜索数据的搜索频率作为事件分类特征。
步骤650,根据所述选取的事件分类特征,检测是否有地震事件发生。
由此,通过上述步骤610-步骤650即可基于关键搜索数据的搜索频率随时间变化的特性,检测是否有地震事件发生。
步骤530,在检测到地震事件时,根据与地震相关的关键搜索数据的地域分布,对检测到的地震事件进行位置估计。
为了能够及时地满足用户的信息需求,可选地,在本申请的一个实施例中,还可获取检测到的地震事件的发生时间,并基于搜索引擎,将检测到的地震事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户。
作为一种示例,获取地震事件监管中心服务器发布的地震速报信息,并根据所述地震速报信息、所述检测到的地震事件的发生时间和位置估计,判断是否真的有地震发生,若是,则基于所述搜索引擎,将所述检测到的地震事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户;若否,则基于所述搜索引擎,生成安全信息,并将所述安全信息作为搜索结果反馈给所述进行搜索的用户,以让群众不要惊慌,没有破坏性地震事件发生,这样就可以有针对性的,及时准确的发布地震事件消息,最快的满足了用户的信息需求。
根据本申请实施例的基于搜索引擎的地震事件检测方法,基于搜索引擎的搜索数据,获取与地震相关的关键搜索数据,并根据与地震相关的关键搜索数据进行地震事件检测,在检测到地震事件时,根据与地震相关的关键搜索数据的地域分布,对检测到的地震事件进行位置估计。即基于搜索引擎中的搜索数据实现地震事件的检测,使用搜索引擎的实时搜索数据进行地震事件检测可以反映人们对地震的感受,实现可能发生地震事件的位置估计,能够在没有物理地震检测设备(如物理地震台网)的地方使用,只要有网络有用户基于搜索引擎进行搜索就可进行地震事件监测,这种检测方式不受物理监测设备的建设条件、建设地区以及建设所需资金等因素的影响,与传统的依靠物理监测设备来检测地震事件而言,扩大了监测范围。
与上述几种实施例提供的基于搜索引擎的区域性事件检测方法相对应,本申请的一种实施例还提供一种基于搜索引擎的区域性事件检测装置,由于本申请实施例提供的基于搜索引擎的区域性事件检测装置与上述几种实施例提供的基于搜索引擎的区域性事件检测方法相对应,因此在前述基于搜索引擎的区域性事件检测方法的实施方式也适用于本实施例提供的基于搜索引擎的区域性事件检测装置,在本实施例中不再详细描述。图7是根据本申请一个实施例的基于搜索引擎的区域性事件检测装置的结构示意图。如图7所示,该基于搜索引擎的区域性事件检测装置700可以包括:搜索数据获取模块710、事件检测模块720和位置估计模块730。
搜索数据获取模块710用于基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据。其中,在本申请的实施例中,该搜索数据包括搜索内容和搜索时间。作为一种示例,搜索数据获取模块710具体用于:基于搜索数据中的搜索内容,从所述搜索引擎的搜索数据中,选取包含预设关键字的目标搜索数据;根据所述目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,以计算每种搜索与突发区域性事件的关联程度;根据所述每种搜索与突发区域性事件的关联程度,从所述目标搜索数据中选取所述与区域性事件相关的关键搜索数据。
在本申请的实施例中,搜索数据获取模块710根据所述目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,得到所述每种搜索在发生区域性事件前的平均搜索频率和在发生区域性事件后的平均搜索频率;根据所述每种搜索在发生区域性事件前的平均搜索频率和在发生区域性事件后的平均搜索频率计算每种搜索与突发区域性事件的关联程度。
事件检测模块720用于根据与区域性事件相关的关键搜索数据进行区域性事件检测。作为一种示例,如图8所示,该事件检测模块720包括:时间序列生成单元721和事件检测单元722。其中,时间序列生成单元721用于根据所述关键搜索数据中的搜索内容和搜索时间,将所述关键搜索数据转化为时间序列,其中,所述时间序列包括多个时间点和每个时间点所对应的关键搜索数据的搜索频率;事件检测单元722用于根据所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,检测是否有区域性事件发生。
在本申请的实施例中,事件检测单元722具体用于:选取多个微分时间间隔;根据所述多个微分时间间隔、所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,计算所述每个时间点的多间隔微分序列值;根据所述每个时间点的多间隔微分序列值,确定检测到有事件发生的检测时间点;选取所述检测时间点前第二预设时间的关键搜索数据的搜索频率作为事件分类特征;根据所述选取的事件分类特征,检测是否有区域性事件发生。
在本申请的实施例中,事件检测单元722具体用于:针对所述每个时间点,根据所述每个时间点的多间隔微分序列值计算每个间隔的短时平均值和长时平均值;根据所述每个间隔的短时平均值和长时平均值,计算所述每个间隔的短时平均值与长时平均值的比值;当判断在一个时间点之前最大微分时间间隔的时间内,所述每个间隔的比值均大于所述每个间隔的预设阈值时,检测到有区域性事件发生,并将所述一个时间点确定为所述检测到有事件发生的检测时间点。
位置估计模块730用于在检测到区域性事件时,根据与区域性事件相关的关键搜索数据的地域分布,对检测到的区域性事件进行位置估计。
为了能够及时地满足用户的信息需求,可选地,在本申请的一个实施例中,如图9所示,该基于搜索引擎的区域性事件检测装置700还可包括:事件发生时间获取模块740和事件检测结果反馈模块750。其中,事件发生时间获取模块740用于获取检测到的区域性事件的发生时间;事件检测结果反馈模块750用于基于搜索引擎,将检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户。
作为一种示例,事件检测结果反馈模块750具体用于:获取区域性事件监管中心服务器发布的区域性事件速报信息;根据所述区域性事件速报信息、所述检测到的区域性事件的发生时间和位置估计,判断是否真的有区域性事件发生;若是,则基于所述搜索引擎,将所述检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户;若否,则基于所述搜索引擎,生成安全信息,并将所述安全信息作为搜索结果反馈给所述进行搜索的用户,以让群众不要惊慌,没有破坏性区域性事件发生,这样就可以有针对性的,及时准确的发布区域性事件消息,最快的满足了用户的信息需求。
根据本申请实施例的基于搜索引擎的区域性事件检测装置,基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据,并根据与区域性事件相关的关键搜索数据进行区域性事件检测,在检测到区域性事件时,根据与区域性事件相关的关键搜索数据的地域分布,对检测到的区域性事件进行位置估计。即基于搜索引擎中的搜索数据实现区域性事件的检测,使用搜索引擎的实时搜索数据进行区域性事件检测可以反映人们对区域性事件的感受,实现可能发生区域性事件的位置估计,能够在没有物理区域性事件检测设备(如物理地震台网)的地方使用,只要有网络有用户基于搜索引擎进行搜索就可进行区域性事件监测,这种检测方式不受物理监测设备的建设条件、建设地区以及建设所需资金等因素的影响,与传统的依靠物理监测设备来检测区域性事件而言,扩大了监测范围。
为了实现上述实施例,本申请还提出了一种搜索引擎,该搜索引擎可以包括本申请上述任一个实施例所述的基于搜索引擎的区域性事件检测装置。
为了实现上述实施例,本申请还提出了一种计算机设备。
图10是根据本申请一个实施例的计算机设备的结构示意图。如图10所示,该计算机设备1000可以包括:存储器1010、处理器1020及存储在存储器1010上并可在处理器1020上运行的计算机程序1030,处理器1020执行程序1030时,实现本申请上述任一个实施例所述的基于搜索引擎的区域性事件检测方法。
为了实现上述实施例,本申请还提出了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现本申请上述任一个实施例所述的基于搜索引擎的区域性事件检测方法。
在本申请的描述中,需要理解的是,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征的数量。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括至少一个该特征。在本申请的描述中,“多个”的含义是至少两个,例如两个,三个等,除非另有明确具体的限定。
在本说明书的描述中,参考术语“一个实施例”、“一些实施例”、“示例”、“具体示例”、或“一些示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本申请的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不必须针对的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任一个或多个实施例或示例中以合适的方式结合。此外,在不相互矛盾的情况下,本领域的技术人员可以将本说明书中描述的不同实施例或示例以及不同实施例或示例的特征进行结合和组合。
流程图中或在此以其他方式描述的任何过程或方法描述可以被理解为,表示包括一个或更多个用于实现定制逻辑功能或过程的步骤的可执行指令的代码的模块、片段或部分,并且本申请的优选实施方式的范围包括另外的实现,其中可以不按所示出或讨论的顺序,包括根据所涉及的功能按基本同时的方式或按相反的顺序,来执行功能,这应被本申请的实施例所属技术领域的技术人员所理解。
在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,"计算机可读介质"可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。计算机可读介质的更具体的示例(非穷尽性列表)包括以下:具有一个或多个布线的电连接部(电子装置),便携式计算机盘盒(磁装置),随机存取存储器(RAM),只读存储器(ROM),可擦除可编辑只读存储器(EPROM或闪速存储器),光纤装置,以及便携式光盘只读存储器(CDROM)。另外,计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质,因为可以例如通过对纸或其他介质进行光学扫描,接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序,然后将其存储在计算机存储器中。
应当理解,本申请的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中,多个步骤或方法可以用存储在存储器中且由合适的指令执行系统执行的软件或固件来实现。如,如果用硬件来实现和在另一实施方式中一样,可用本领域公知的下列技术中的任一项或他们的组合来实现:具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路,具有合适的组合逻辑门电路的专用集成电路,可编程门阵列(PGA),现场可编程门阵列(FPGA)等。
本技术领域的普通技术人员可以理解实现上述实施例方法携带的全部或部分步骤是可以通过程序来指令相关的硬件完成,所述的程序可以存储于一种计算机可读存储介质中,该程序在执行时,包括方法实施例的步骤之一或其组合。
此外,在本申请各个实施例中的各功能单元可以集成在一个处理模块中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,也可以存储在一个计算机可读取存储介质中。
上述提到的存储介质可以是只读存储器,磁盘或光盘等。尽管上面已经示出和描述了本申请的实施例,可以理解的是,上述实施例是示例性的,不能理解为对本申请的限制,本领域的普通技术人员在本申请的范围内可以对上述实施例进行变化、修改、替换和变型。
Claims (19)
1.一种基于搜索引擎的区域性事件检测方法,其特征在于,包括以下步骤:
基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据;
根据所述与区域性事件相关的关键搜索数据进行区域性事件检测;
在检测到区域性事件时,根据所述与区域性事件相关的关键搜索数据的地域分布,对所述检测到的区域性事件进行位置估计。
2.根据权利要求1所述的方法,其特征在于,所述搜索数据包括搜索内容和搜索时间;所述基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据,包括:
基于搜索数据中的搜索内容,从所述搜索引擎的搜索数据中,选取包含预设关键字的目标搜索数据;
根据所述目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,以计算每种搜索与突发区域性事件的关联程度;
根据所述每种搜索与突发区域性事件的关联程度,从所述目标搜索数据中选取所述与区域性事件相关的关键搜索数据。
3.根据权利要求2所述的方法,其特征在于,所述根据所述目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,以计算每种搜索与突发区域性事件的关联程度,包括:
根据所述目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,得到所述每种搜索在发生区域性事件前的平均搜索频率和在发生区域性事件后的平均搜索频率;
根据所述每种搜索在发生区域性事件前的平均搜索频率和在发生区域性事件后的平均搜索频率计算每种搜索与突发区域性事件的关联程度。
4.根据权利要求1所述的方法,其特征在于,所述根据所述与区域性事件相关的关键搜索数据进行区域性事件检测,包括:
根据所述关键搜索数据中的搜索内容和搜索时间,将所述关键搜索数据转化为时间序列,其中,所述时间序列包括多个时间点和每个时间点所对应的关键搜索数据的搜索频率;
根据所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,检测是否有区域性事件发生。
5.根据权利要求4所述的方法,其特征在于,所述根据所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,检测是否有区域性事件发生,包括:
选取多个微分时间间隔;
根据所述多个微分时间间隔、所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,计算所述每个时间点的多间隔微分序列值;
根据所述每个时间点的多间隔微分序列值,确定检测到有事件发生的检测时间点;
选取所述检测时间点前第二预设时间的关键搜索数据的搜索频率作为事件分类特征;
根据所述选取的事件分类特征,检测是否有区域性事件发生。
6.根据权利要求5所述的方法,其特征在于,所述根据所述每个时间点的多间隔微分序列值,确定检测到有事件发生的检测时间点,包括:
针对所述每个时间点,根据所述每个时间点的多间隔微分序列值计算每个间隔的短时平均值和长时平均值;
根据所述每个间隔的短时平均值和长时平均值,计算所述每个间隔的短时平均值与长时平均值的比值;
当判断在一个时间点之前最大微分时间间隔的时间内,所述每个间隔的比值均大于所述每个间隔的预设阈值时,检测到有区域性事件发生,并将所述一个时间点确定为所述检测到有事件发生的检测时间点。
7.根据权利要求1至6中任一项所述的方法,其特征在于,还包括:
获取所述检测到的区域性事件的发生时间;
基于所述搜索引擎,将所述检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户。
8.根据权利要求7所述的方法,其特征在于,所述基于所述搜索引擎,将所述检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户,包括:
获取区域性事件监管中心服务器发布的区域性事件速报信息;
根据所述区域性事件速报信息、所述检测到的区域性事件的发生时间和位置估计,判断是否真的有区域性事件发生;
若是,则基于所述搜索引擎,将所述检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户;
若否,则基于所述搜索引擎,生成安全信息,并将所述安全信息作为搜索结果反馈给所述进行搜索的用户。
9.一种基于搜索引擎的区域性事件检测装置,其特征在于,包括:
搜索数据获取模块,用于基于搜索引擎的搜索数据,获取与区域性事件相关的关键搜索数据;
事件检测模块,用于根据所述与区域性事件相关的关键搜索数据进行区域性事件检测;
位置估计模块,用于在检测到区域性事件时,根据所述与区域性事件相关的关键搜索数据的地域分布,对所述检测到的区域性事件进行位置估计。
10.根据权利要求9所述的装置,其特征在于,所述搜索数据包括搜索内容和搜索时间;所述搜索数据获取模块具体用于:
基于搜索数据中的搜索内容,从所述搜索引擎的搜索数据中,选取包含预设关键字的目标搜索数据;
根据所述目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,以计算每种搜索与突发区域性事件的关联程度;
根据所述每种搜索与突发区域性事件的关联程度,从所述目标搜索数据中选取所述与区域性事件相关的关键搜索数据。
11.根据权利要求10所述的装置,其特征在于,所述搜索数据获取模块具体用于:
根据所述目标搜索数据中的搜索内容和搜索时间,对在发生区域性事件前后第一预设时间段之内每种搜索的数量进行统计,得到所述每种搜索在发生区域性事件前的平均搜索频率和在发生区域性事件后的平均搜索频率;
根据所述每种搜索在发生区域性事件前的平均搜索频率和在发生区域性事件后的平均搜索频率计算每种搜索与突发区域性事件的关联程度。
12.根据权利要求9所述的装置,其特征在于,所述事件检测模块包括:
时间序列生成单元,用于根据所述关键搜索数据中的搜索内容和搜索时间,将所述关键搜索数据转化为时间序列,其中,所述时间序列包括多个时间点和每个时间点所对应的关键搜索数据的搜索频率;
事件检测单元,用于根据所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,检测是否有区域性事件发生。
13.根据权利要求12所述的装置,其特征在于,所述事件检测单元具体用于:
选取多个微分时间间隔;
根据所述多个微分时间间隔、所述时间序列中的多个时间点和每个时间点所对应的关键搜索数据的搜索频率,计算所述每个时间点的多间隔微分序列值;
根据所述每个时间点的多间隔微分序列值,确定检测到有事件发生的检测时间点;
选取所述检测时间点前第二预设时间的关键搜索数据的搜索频率作为事件分类特征;
根据所述选取的事件分类特征,检测是否有区域性事件发生。
14.根据权利要求13所述的装置,其特征在于,所述事件检测单元具体用于:
针对所述每个时间点,根据所述每个时间点的多间隔微分序列值计算每个间隔的短时平均值和长时平均值;
根据所述每个间隔的短时平均值和长时平均值,计算所述每个间隔的短时平均值与长时平均值的比值;
当判断在一个时间点之前最大微分时间间隔的时间内,所述每个间隔的比值均大于所述每个间隔的预设阈值时,检测到有区域性事件发生,并将所述一个时间点确定为所述检测到有事件发生的检测时间点。
15.根据权利要求9至14中任一项所述的装置,其特征在于,还包括:
事件发生时间获取模块,用于获取所述检测到的区域性事件的发生时间;
事件检测结果反馈模块,用于基于所述搜索引擎,将所述检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户。
16.根据权利要求15所述的装置,其特征在于,所述事件检测结果反馈模块具体用于:
获取区域性事件监管中心服务器发布的区域性事件速报信息;
根据所述区域性事件速报信息、所述检测到的区域性事件的发生时间和位置估计,判断是否真的有区域性事件发生;
若是,则基于所述搜索引擎,将所述检测到的区域性事件的发生时间和位置估计作为搜索结果反馈给进行搜索的用户;
若否,则基于所述搜索引擎,生成安全信息,并将所述安全信息作为搜索结果反馈给所述进行搜索的用户。
17.一种搜索引擎,其特征在于,包括:如权利要求9至16中任一项所述的基于搜索引擎的区域性事件检测装置。
18.一种计算机设备,其特征在于,包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述程序时,实现如权利要求1至8中任一项所述的基于搜索引擎的区域性事件检测方法。
19.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8中任一项所述的基于搜索引擎的区域性事件检测方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696186.1A CN112307360B (zh) | 2019-07-30 | 2019-07-30 | 基于搜索引擎的区域性事件检测方法、装置和搜索引擎 |
US16/939,980 US11449567B2 (en) | 2019-07-30 | 2020-07-27 | Method and apparatus for detecting regional event based on search engine, and storage medium |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201910696186.1A CN112307360B (zh) | 2019-07-30 | 2019-07-30 | 基于搜索引擎的区域性事件检测方法、装置和搜索引擎 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN112307360A true CN112307360A (zh) | 2021-02-02 |
CN112307360B CN112307360B (zh) | 2023-08-25 |
Family
ID=74259519
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201910696186.1A Active CN112307360B (zh) | 2019-07-30 | 2019-07-30 | 基于搜索引擎的区域性事件检测方法、装置和搜索引擎 |
Country Status (2)
Country | Link |
---|---|
US (1) | US11449567B2 (zh) |
CN (1) | CN112307360B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553407A (zh) * | 2021-06-18 | 2021-10-26 | 北京百度网讯科技有限公司 | 事件追溯方法、装置、电子设备及存储介质 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113314233B (zh) * | 2021-07-30 | 2021-12-21 | 明品云(北京)数据科技有限公司 | 一种事件追踪处理方法、系统、设备和介质 |
Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080133503A1 (en) * | 2006-11-30 | 2008-06-05 | Yahoo! Inc. | Keyword bidding strategy for novel concepts |
US20130129307A1 (en) * | 2011-11-23 | 2013-05-23 | Objectvideo, Inc. | Automatic event detection, text generation, and use thereof |
US20140039963A1 (en) * | 2012-08-03 | 2014-02-06 | Skybox Imaging, Inc. | Satellite scheduling system |
KR101605845B1 (ko) * | 2014-09-24 | 2016-03-23 | 주식회사 엘지씨엔에스 | 이벤트 검색 방법, 이를 수행하는 이벤트 검색 서버 및 이를 저장하는 기록매체 |
CN107704561A (zh) * | 2017-09-29 | 2018-02-16 | 珠海市魅族科技有限公司 | 一种搜索方法、装置、计算机装置及可读存储介质 |
CN107832444A (zh) * | 2017-11-21 | 2018-03-23 | 北京百度网讯科技有限公司 | 基于搜索日志的事件发现方法及装置 |
CN108197198A (zh) * | 2017-12-27 | 2018-06-22 | 百度在线网络技术(北京)有限公司 | 一种兴趣点搜索方法、装置、设备和介质 |
US20180246967A1 (en) * | 2017-02-28 | 2018-08-30 | Microsoft Technology Licensing, Llc | Content event insights |
Family Cites Families (29)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8126874B2 (en) * | 2006-05-09 | 2012-02-28 | Google Inc. | Systems and methods for generating statistics from search engine query logs |
EP2074505A4 (en) * | 2006-10-05 | 2010-01-13 | Splunk Inc | CHRONOLOGICAL SERIES SEARCH ENGINE |
US7937403B2 (en) * | 2006-10-30 | 2011-05-03 | Yahoo! Inc. | Time-based analysis of related keyword searching |
US8032302B1 (en) * | 2007-01-02 | 2011-10-04 | Strategic Design Federation W, Inc. | Method and system of modifying weather content |
US7644075B2 (en) * | 2007-06-01 | 2010-01-05 | Microsoft Corporation | Keyword usage score based on frequency impulse and frequency weight |
US7428522B1 (en) * | 2007-09-27 | 2008-09-23 | Yahoo! Inc. | Real-time search term popularity determination, by search origin geographic location |
US9953083B2 (en) * | 2010-02-16 | 2018-04-24 | Excalibur Ip, Llc | System and method for determining an authority rank for real time searching |
US9002892B2 (en) * | 2011-08-07 | 2015-04-07 | CitizenNet, Inc. | Systems and methods for trend detection using frequency analysis |
US20140081973A1 (en) * | 2012-09-14 | 2014-03-20 | Google Inc. | Spike classification |
US8554873B1 (en) * | 2012-10-05 | 2013-10-08 | Google Inc. | Custom event and attraction suggestions |
US9648075B1 (en) * | 2012-12-18 | 2017-05-09 | Google Inc. | Systems and methods for providing an event map |
WO2014127204A2 (en) * | 2013-02-15 | 2014-08-21 | Battelle Memorial Institue | Use of web-based symptom checker data to predict incidence of a disease or disorder |
US20150169628A1 (en) * | 2013-03-14 | 2015-06-18 | Google Inc. | Location detection from queries using evidence for location alternatives |
US9152667B1 (en) * | 2013-03-15 | 2015-10-06 | A9.Com, Inc. | Cloud search analytics |
WO2015007945A1 (en) * | 2013-07-18 | 2015-01-22 | Nokia Corporation | Method and apparatus for updating points of interest information via crowdsourcing |
US20150058743A1 (en) * | 2013-08-26 | 2015-02-26 | Kristopher R. Wall | Method And System For Displaying Event Information |
US9262908B2 (en) * | 2014-01-02 | 2016-02-16 | Avaya Inc. | Method and system for alerting contactees of emergency event |
US9785661B2 (en) * | 2014-02-07 | 2017-10-10 | Microsoft Technology Licensing, Llc | Trend response management |
US20160092918A1 (en) * | 2014-09-30 | 2016-03-31 | Steve Cha | Real-time announcements at a given location within a specific geographical radius |
US10212243B2 (en) * | 2015-03-13 | 2019-02-19 | Oath Inc. | Future event detection and notification |
JP2018514890A (ja) * | 2015-05-15 | 2018-06-07 | パイド パーカー, インコーポレイテッドPied Parker, Inc. | 駐車場管理システム及びその運用方法 |
US10467561B2 (en) * | 2015-11-05 | 2019-11-05 | Gt Gettaxi Limited | System for identifying events and preemptively navigating drivers to transport passengers from the events |
US10791073B2 (en) * | 2015-12-17 | 2020-09-29 | HomeAway.com, Inc. | Event detection using inquiries |
US10440092B2 (en) * | 2016-05-18 | 2019-10-08 | The Boeing Company | Alert generation based on proximate events identified by source data analytics |
US11416817B2 (en) * | 2017-06-02 | 2022-08-16 | Apple Inc. | Event extraction systems and methods |
US10313413B2 (en) * | 2017-08-28 | 2019-06-04 | Banjo, Inc. | Detecting events from ingested communication signals |
CN107908616B (zh) * | 2017-10-18 | 2022-01-28 | 北京京东尚科信息技术有限公司 | 预测趋势词的方法和装置 |
US11416535B2 (en) * | 2018-04-20 | 2022-08-16 | Microsoft Technology Licensing, Llc | User interface for visualizing search data |
US10671651B1 (en) * | 2019-12-31 | 2020-06-02 | Banjo, Inc. | Deriving signal location information |
-
2019
- 2019-07-30 CN CN201910696186.1A patent/CN112307360B/zh active Active
-
2020
- 2020-07-27 US US16/939,980 patent/US11449567B2/en active Active
Patent Citations (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20080133503A1 (en) * | 2006-11-30 | 2008-06-05 | Yahoo! Inc. | Keyword bidding strategy for novel concepts |
US20130129307A1 (en) * | 2011-11-23 | 2013-05-23 | Objectvideo, Inc. | Automatic event detection, text generation, and use thereof |
US20140039963A1 (en) * | 2012-08-03 | 2014-02-06 | Skybox Imaging, Inc. | Satellite scheduling system |
KR101605845B1 (ko) * | 2014-09-24 | 2016-03-23 | 주식회사 엘지씨엔에스 | 이벤트 검색 방법, 이를 수행하는 이벤트 검색 서버 및 이를 저장하는 기록매체 |
US20180246967A1 (en) * | 2017-02-28 | 2018-08-30 | Microsoft Technology Licensing, Llc | Content event insights |
CN107704561A (zh) * | 2017-09-29 | 2018-02-16 | 珠海市魅族科技有限公司 | 一种搜索方法、装置、计算机装置及可读存储介质 |
CN107832444A (zh) * | 2017-11-21 | 2018-03-23 | 北京百度网讯科技有限公司 | 基于搜索日志的事件发现方法及装置 |
CN108197198A (zh) * | 2017-12-27 | 2018-06-22 | 百度在线网络技术(北京)有限公司 | 一种兴趣点搜索方法、装置、设备和介质 |
Non-Patent Citations (1)
Title |
---|
JIE ZHANG;HAIJIANG ZHANG;ENHONG CHEN;YI ZHENG;WENHUAN KUANG;XIONG ZHANG;王林;: "搜索引擎方法在实时地震监测中的应用", 国际地震动态, no. 10 * |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN113553407A (zh) * | 2021-06-18 | 2021-10-26 | 北京百度网讯科技有限公司 | 事件追溯方法、装置、电子设备及存储介质 |
Also Published As
Publication number | Publication date |
---|---|
US11449567B2 (en) | 2022-09-20 |
US20210034689A1 (en) | 2021-02-04 |
CN112307360B (zh) | 2023-08-25 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110601900B (zh) | 一种网络故障预警方法及装置 | |
CN110210508B (zh) | 模型生成方法、异常流量检测方法、装置、电子设备、计算机可读存储介质 | |
KR101825023B1 (ko) | 리스크 조기 경보 방법 및 장치 | |
CN103295584B (zh) | 音声数据检测装置、音声监控系统及其方法 | |
CN112307360B (zh) | 基于搜索引擎的区域性事件检测方法、装置和搜索引擎 | |
EP2399104A1 (en) | Method and apparatus for monitoring and analyzing vibrations in rotary machines | |
CN106327230B (zh) | 一种异常用户检测方法及设备 | |
CN110933115B (zh) | 基于动态session的分析对象行为异常检测方法及装置 | |
CN116170566A (zh) | 一种智慧楼宇监控管理方法、装置、电子设备及存储介质 | |
Wei et al. | Detecting latest local events from geotagged tweet streams | |
Liguori et al. | Towards the evaluation of the measurement uncertainty of environmental acoustic noise | |
CN105139869A (zh) | 一种基于区间差分特征的婴儿啼哭检测方法 | |
CN118053261A (zh) | 用于智慧校园的防欺凌预警方法、装置、设备及介质 | |
CN107451029B (zh) | 一种信息处理方法及装置、设备 | |
KR20160133198A (ko) | 키워드 관련도 기반의 재난 이슈별 재난 탐지 기술 및 이를 이용한 재난대처 방법 | |
CN114462897A (zh) | 高速公路机电系统综合性能评估方法、装置及存储介质 | |
CN110381152B (zh) | 推送资源自动播放量的统计方法、统计装置及电子设备 | |
CN111125195A (zh) | 一种数据异常检测方法及装置 | |
KR102177488B1 (ko) | 미디어를 활용한 지수 결정 방법 및 그를 위한 시스템 | |
Effa et al. | Convolutional neural network for audibility assessment of acoustic alarms | |
CN113053064A (zh) | 一种面向区域性地震预警系统评测方法及评测系统 | |
JPWO2022074777A5 (zh) | ||
JP6994874B2 (ja) | アノテーション装置および騒音測定システム | |
Zhu et al. | Intrusion detection system based on data mining for host log | |
CN101923605A (zh) | 铁路防灾风预警方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |