CN112966014A - 查找目标对象的方法和装置 - Google Patents

查找目标对象的方法和装置 Download PDF

Info

Publication number
CN112966014A
CN112966014A CN201911274000.XA CN201911274000A CN112966014A CN 112966014 A CN112966014 A CN 112966014A CN 201911274000 A CN201911274000 A CN 201911274000A CN 112966014 A CN112966014 A CN 112966014A
Authority
CN
China
Prior art keywords
event
target
path
sample
candidate object
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201911274000.XA
Other languages
English (en)
Inventor
刘晨
唐超
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alibaba Group Holding Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201911274000.XA priority Critical patent/CN112966014A/zh
Publication of CN112966014A publication Critical patent/CN112966014A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2458Special types of queries, e.g. statistical queries, fuzzy queries or distributed queries
    • G06F16/2462Approximate or statistical queries
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/243Classification techniques relating to the number of classes
    • G06F18/24323Tree-organised classifiers

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Probability & Statistics with Applications (AREA)
  • General Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Computation (AREA)
  • Evolutionary Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Fuzzy Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Databases & Information Systems (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请公开了一种查找目标对象的方法和装置。其中,该方法包括:首先获取与目标事件相关联的候选对象的行为特征信息,然后根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:已完成的样本事件和样本事件的目标对象,最后根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。本申请解决了相关技术中确定与事件相关的主体的效率较低的技术问题。

Description

查找目标对象的方法和装置
技术领域
本申请涉及数据分析领域,具体而言,涉及一种查找目标对象的方法和装置。
背景技术
随着信息化建设的高速发展,各行业信息化程度也越来越高,针对事件的分析也越来越复杂,传统的查询、统计等方法难以发现事件背后的关联和规律,数据丰富而手段匮乏制约了对事件的分析工作。
在一般场景中,面临的主要问题之一就是在事件发生后,寻找与该事件有直接关联的对象,通常会根据事件发生地点附近的轨迹数据进行分析,找到在事件时空出现过的对象,通过关联度模型进行分析,推荐出关联度最高的对象。具体可以是先需要根据事件的时间空间在路径数据库里寻找一定范围内出现的对象,确定对象范围。但对象在到达事件发生地点的起始时间无法准确得到,另外,若事件发生在对象较多的场景下,那么确定出来的对象数量也会非常大,给下一步的研判造成较大的工作量和难度。
针对相关技术中确定与事件相关的主体的效率较低的技术问题,目前尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种查找目标对象的方法和装置,以至少解决相关技术中确定与事件相关的主体的效率较低的技术问题。
根据本申请实施例的一个方面,提供了一种查找目标对象方法,包括:获取与目标事件相关联的候选对象的行为特征信息;根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和样本对象与样本事件的关联度参数;根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。
根据本申请实施例的另一方面,还提供了一种查找目标对象装置,包括:获取模块、预测模块、和确定模块。其中,获取模块,用于获取与目标事件相关联的候选对象的行为特征信息;预测模块,用于根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和样本对象与样本事件的关联度参数;确定模块,用于根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。
根据本申请实施例的另一方面,还提供了一种存储介质,存储介质包括存储的程序,其中,在程序运行时控制存储介质所在设备执行上述查找目标对象的方法。
根据本申请实施例的另一方面,还提供了一种处理器,处理器用于运行程序,其中,程序运行时执行上述查找目标对象的方法。
在本申请实施例中,首先获取与目标事件相关联的候选对象的行为特征信息,然后根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和样本对象与样本事件的关联度参数,最后根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。与现有技术相比,本申请提出了对象与事件的关联度的概念,将已经发生的事件作为样本,训练关联度预测模型,以预测出每一个候选对象对应的对象与事件的关联度;通过时空共现建立对象和事件的连接关系,然后再计算对象与事件的关联度,达到了确定相关主体的目的,进而解决了相关技术中确定事件执行对象的效率较低的技术问题。
附图说明
此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
图1是根据本申请实施例的一种用于实现查找目标对象的方法的计算设备的硬件结构框图;
图2是根据本申请实施例的一种计算设备作为客户终端的示意图;
图3是根据本申请实施例1的一种可选的查找目标对象的方法的流程图;
图4是根据本申请实施例1的一种可选的获取对象与事件的关联度的方法流程图;
图5是根据本申请实施例2的一种可选的查找目标对象的装置示意图;以及
图6是根据本申请实施例3的一种可选的计算设备的结构框图。
具体实施方式
为了使本技术领域的人员更好地理解本申请方案,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分的实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本申请保护的范围。
需要说明的是,本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
首先,在对本申请实施例进行描述的过程中出现的部分名词或术语适用于如下解释:
轨迹位置数据:指一系列行为事件发生的时间、地点序列,通常由时间、经纬度组成,表示轨迹对象在时间点所处的地理位置。
循环神经网络(Recurrent Neural Network,RNN):可以输入不定长的时序数据,在序列的演进方向进行递归且所有节点(循环单元)按链式连接的递归神经网络,能够学习时间上的上下文关系,常用于自然语言处理中对文本进行向量表示,也适用于具有时间序列特点的其他类型数据。
随机森林(Random Forest):随机森林算法是指利用多棵决策树对样本进行训练并预测的一种算法,其输出的类别是由个别决策树输出的类别的众树来决定的。
实施例1
根据本申请实施例,还提供了一种查找目标对象的方法的实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
本申请实施例1所提供的方法实施例可以在计算设备或者类似的运算装置中执行。图1示出了一种用于实现查找目标对象的方法的计算设备的硬件结构框图。如图1所示,计算设备10可以包括一个或多个(图中采用102a、102b,……,102n来示出)处理器102(处理器102可以包括但不限于微处理器MCU或可编程逻辑器件FPGA等的处理装置)、用于存储数据的存储器104、以及用于通信功能的传输装置106。除此以外,还可以包括:显示器、输入/输出接口、通用串行总线(USB)端口(可以作为输入/输出接口的端口中的一个端口被包括)、网络接口、电源和/或相机。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述电子装置的结构造成限定。例如,计算设备10还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
应当注意到的是上述一个或多个处理器102和/或其他数据处理电路可以全部或部分的体现为软件、硬件、固件或其他任意组合。此外,数据处理电路可为单个独立的处理模块,或全部或部分的结合到计算设备10中的其他元件中的任意一个内。
存储器104可用于存储应用软件的软件程序以及模块,如本申请实施例中的查找目标对象的方法对应的程序指令/数据存储装置,处理器102通过运行存储在存储器104内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的查找目标对象的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至计算设备10。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
传输装置106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括计算设备10的通信供应商提供的无线网络。在一个实例中,传输装置106包括一个网络适配器(Network Interface Controller,NIC),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输装置106可以为射频(Radio Frequency,RF)模块,其用于通过无线方式与互联网进行通讯。
显示器可以例如触摸屏式的液晶显示器(LCD),该液晶显示器可使得用户能够与计算设备10的用户界面进行交互。
图1示出的硬件结构框图,不仅可以作为上述计算设备10的示例性框图,还可以作为一种服务器的示例性框图,一种可选实施例中,图2以框图示出了使用上述图1所示的计算设备10作为客户终端的一种实施例。如图2所示,计算设备10可以经由数据网络连接或电子连接到一个或多个服务器66。一种可选实施例中,上述计算设备10可以是移动计算设备等。数据网络连接可以是局域网连接、广域网连接、因特网连接,或其他类型的数据网络连接。计算设备10可以执行以连接到由一个服务器(例如安全服务器)或一组服务器执行的网络服务。网络服务器是基于网络的用户服务,诸如社交网络、云资源、电子邮件、在线支付或其他在线应用。
在图1示出的计算设备的处理器中,或在图2示出的与计算设备通信的服务器中,本申请提供了如图3所示的查找目标对象的方法。图3是根据本申请实施例的一种查找目标对象的方法的流程图。如图3所示,该方法可以包括如下步骤:
步骤S302,获取与目标事件相关联的候选对象的行为特征信息。
一种可选方案中,上述目标事件可以为待分析的事件;上述行为特征信息可以为候选对象的轨迹位置数据;上述获取行为特征信息的方式可以通过事件发生地附近的采集设备获得。
所谓轨迹位置数据,指一系列行为事件发生的时间、地点序列,通常由时间、经纬度组成,表示候选对象在时间点所处的地理位置。
上述候选对象可以是人物、还可以是车辆、船只、飞机、无人机、物流车、机器人等。
在一种可选的实施例中,可以通过目标事件发生地附近的摄像头采集事件发生时间附近经过的对象的行为特征信息。
步骤S304,根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和所述样本对象与所述样本事件的关联度参数。
一种可选方案中,上述关联度预测模型可以为具有预测功能的机器学习模型,如神经网络模型等,本申请以随机森林算法为例进行举例说明,然而其并不会对本申请的关联度预测模型造成限制。
随机森林算法是指利用多棵决策树对样本进行训练并预测的一种算法,其输出的类别是由个别决策树输出的类别的众树来决定的,该算法可以处理大量的输入变量,并产生高准确度的分类器。
需要说明的是,关联度预测模型需要结合大量的关联度样本进行训练测试才会完善精确。关联度样本越多,所训练出来的模型越精确,相应地,训练时间越长。
一种可选方案中,通过使用对象与事件的关联度对候选集合的候选对象进行排序,可以客观地筛选出关联度排序较高的对象。
一种可选方案中,上述关联度样本数据可以包括样本事件、样本对象的行为特征信息和所述样本对象与所述样本事件的关联度参数。样本事件可以是已经完成的事件,样本对象可以是根据事件的时空与路径数据的分析得到对象,例如,在事件发生的预设时间内,出现在以事件地点为中心的预设范围的对象;如果样本对象是与事件关联的对象,则样本对象与样本事件的关联度参数可以为1,如果样本对象是与事件不关联的对象,则样本对象与样本事件的关联度参数可以为0,可以将关联度参数为1的样本对象的行为特征信息作为正样本,将关联度参数为0的样本对象的行为特征信息作为负样本,同时包括正样本和负样本的输入可以使关联度预测模型更加精确。
步骤S306,根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。
一种可选方案中,上述关联度参数越大,表明该候选对象与目标事件相关联的可能性越大,上述目标对象可以为目标事件的执行对象。
上述步骤中,通过关联度预测模型预测出候选对象与目标事件的关联度参数之后,可以帮助分析人员在事件时空周边出现的候选对象集合中快速筛选出目标对象,避免了主观因素的影响。
在一个可选的实施例中,分析人员对夜晚发生的事件进行分析,分析人员调取事发地附近所有摄像头的影像资料,提取出事件发生夜晚路过事发地的所有对象的轨迹信息,并将这些轨迹信息输入至关联度预测模型。关联度预测模型结合后台大数据,输出经过对象与该事件的关联度参数,供分析人员参考。分析人员根据关联度参数的大小,便可以快速确定目标对象。
在另一种可选的实施例中,目标事件可以是生产场地发生的安全事故,候选对象可以是生产场地的生产设备,通过上述方案可以从所有的生产设备中选择出与安全事故最相关的设备。
在又一种可选的实施例中,目标事件还可以是工作人员工作过程中的违规行为,例如机场地勤人员的违规行为、工厂工人违反安全生产规定的行为等,候选对象即为每个工作人员,通过上述方案,可以从所有的工作人员中筛选出与违规行为相关度最高的工作人员。
在再一种可选的实施例中,上述方案还可以用于支付场景中的风险监测,目标事件可以是具有一定风险的支付行为,候选对象即可以是实时监测到的操作,通过上述方案,可以确定出与具有一定风险的支付行为相关联的操作,从而能够进行制止或进行其他动作,进而起到了保障支付安全的目的。
在其他可选的实施例中,上述方案还可以用于网络内容的推荐,目标事件可以是根据用户的浏览记录确定的用户感兴趣的浏览内容,候选对象可以是多个待推荐的内容,通过上述方案,可以确定与用户感兴趣的浏览内容相关联的其他内容,以实现对网络内容的精准推荐。
基于本申请上述实施例提供的方案,首先获取与目标事件相关联的候选对象的行为特征信息,然后根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和所述样本对象与所述样本事件的关联度参数,最后根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。与现有技术相比,本申请提出了对象与事件关联度的概念,将已经发生的事件作为样本,训练关联度预测模型,以预测出每一个候选对象的对象与事件的关联度;通过时空共现建立对象与事件的连接关系,然后再计算对象与事件的关联度,达到了确定相关主题的目的,进而解决了相关技术中确定与事件相关的主体的效率较低。
可选地,行为特征信息包括:路径特征向量和统计特征信息,上述步骤S302获取与目标事件相关联的候选对象的行为特征信息,具体包括:
步骤S3021,通过路径特征提取模型,提取候选对象的路径特征向量。
一种可选方案中,上述路径特征向量可以为候选对象的轨迹位置点序列,上述统计特征信息可以为候选对象在事件发生前后的活动特征,例如活跃度、轨迹熵、活动范围等。
一种可选方案中,上述路径特征提取模型可以为循环神经网络模型,之所以采用循环神经网络模型,是因为其可以输入不定长的时序数据,学习时间上的上下序列关系。当然,本申请也可以采用其他类似RNN的学习模型。
步骤S3022,确定候选对象在第一时间段内的第一统计特征信息和在第二时间段内的第二统计特征信息之差为统计特征信息,其中,第二时间段用于表示目标事件发生前和/或后的预设时间段,第二时间段小于所述第一时间段。
一种可选方案中,上述第一时间段可以为与目标事件发生时间段较为接近的时间范围,例如目标事件发生的前后三天;上述第二时间段可以为与目标事件发生时间段一般接近的时间范围,例如目标事件发生的前后三十天。
上述步骤中,通过比较候选对象在第一时间段内的第一统计特征信息和在第二时间段内的第二统计特征信息之间的差异,可以发现候选对象在事件发生前后的反常行为,反常行为越多,关联度参数越大。
可选地,上述步骤S3022确定候选对象在第一时间段内的第一统计特征信息和在第二时间段内的第二统计特征信息之差为统计特征信息,包括:
步骤S30221,获取第一时间段内,候选对象在至少一个维度上的第一统计特征信息。
一种可选方案中,上述第一时间段可以为一个月、三个月,用来表征候选对象的长期行为规律。
步骤S30222,获取第二时间段内,候选对象在至少一个维度上的第二统计特征信息。
一种可选方案中,上述第二时间段可以为一天、三天,用来表征候选对象的短期行为规律。
一种可选方案中,上述至少一个维度可以为候选对象在目标事件发生前后的活跃度、轨迹熵、活动范围等统计指标,这些指标在一定程度上反映了候选对象在目标事件发生前后是否有与平时不同的异常行为。
步骤S30223,确定第一统计特征信息和第二统计特征信息的差异值为候选对象的统计特征信息。
上述步骤中,通过路径特征提取模型,提取候选对象的路径特征向量,通过统计,从候选对象的行为特征信息中提取统计特征信息。其中,用统计特征信息对目标事件发生一段时间内和发生前后的轨迹特点变化情况进行描述,根据第一统计特征信息和第二统计特征信息的差异值可以衡量候选对象在目标事件发生前后是否与平时的行为规律相符合。
可选地,至少一个维度包括:候选对象的移动范围、候选对象的移动轨迹的轨迹熵、候选对象活动地点的数量、候选对象常驻地与目标事件所在地的距离、候选对象所在地与目标事件所在地的平均距离、候选对象在预设时间段内活动地点的数量、候选对象在预设时间段内出现在所述目标事件所在地的时长、所述候选对象出现在所述目标事件所在地的时长或者所述目标事件发生前所述候选对象出现在所述目标事件所在地的时长。
一种可选方案中,上述至少一个维度可以以能描述候选对象行为规律的指标为准进行选取;上述预设时间段可以为夜晚。
表1列出了候选对象的统计特征信息,其中,第一时间段设置为3天,第二时间段设置为三十天。当然,上述统计特征信息包括但不限于表1所列举的特征信息,同样,第一时间段、第二时间段的选取也可以依据事件的发生时间、位置、性质等情况另行选取。通过对长期行为规律和短期行为规律两部分统计指标的差异判断程度,来衡量目标事件发生当天的轨迹分布是否符合长期规律。
表1
Figure BDA0002315027370000081
Figure BDA0002315027370000091
可选地,步骤S3021通过路径特征提取模型,提取候选对象的路径特征向量,包括:
步骤S30211,获取候选对象的路径点序列。
步骤S30212,通过路径特征提取模型,对路径点序列进行特征提取,得到候选对象的路径特征向量。
一种可选方案中,上述路径特征提取模型可以为循环神经网络。根据循环神经网络对轨迹上下序列进行学习,把轨迹序列表示为固定长度的轨迹向量。
在使用关联度预测模型预测对象与事件的关联度之前,需要先获取候选对象的路径特征向量。上述步骤中,在获取到候选对象的路径点序列后,通过路径特征提取模型,对候选对象一段时间内的路径点序列进行特征提取,得到候选对象的路径特征向量。
可选地,上述方法还包括:步骤S301,生成路径特征提取模型,其中,生成路径特征提取模型,包括:
步骤S3011,切分样本路径,得到连续的多段路径。
步骤S3012,确定连续的多段路径中,任意一段路径的路径点序列和下一段路径的路径点序列。
步骤S3013,确定任意一段路径的路径点序列和下一段路径的路径点序列构成路径样本数据。
步骤S3014,根据路径样本数据对初始神经网络模型进行训练,得到路径特征提取模型。
上述步骤中,以循环神经网络为例提取候选对象的路径特征向量,可以更充分地表示路径数据隐含的规律,并且可以把不定长度的路径位置点序列表示成同一长度的特征向量。训练初始轨迹循环神经网络模型时,首先对样本路径进行切分,通过输入一段轨迹位置点序列(t1,t2,...,tn)来预测下一段路径位置点序列(t2,t3,...,tn+1),不断迭代直至循环神经网络模型可以充分描述路径位置点的上下文信息,得到训练好的循环神经网络模型。
还需要说明的是,上述方法使用了tensorflow开源框架实现rnn模型,不涉及代码的修改,具有普适性。
可选地,上述方法还包括:步骤S300,生成关联度预测模型,其中,关联度预测模型为随机森林分类器,生成关联度预测模型的步骤,包括:
步骤S3001,获取关联度样本数据。
步骤S3002,利用关联度样本数据对初始随机森林分类器进行训练,得到关联度预测模型。
如前所述,随机森林算法是指利用多棵决策树对样本进行训练并预测的一种算法,其输出的类别是由个别决策树输出的类别的众树来决定的,该算法可以处理大量的输入变量,并产生高准确度的分类器,因此本申请采用随机森林算法作为关联度预测模型。由于随机森林算法属于机器学习算法,因此,在使用之前,需要先获取关联度样本数据,对其进行训练,得到训练好的关联度预测模型。
一种可选方案中,上述关联度样本数据可以选自与目标事件类型一致的已分析事件。
针对已分析事件构成的路径数据库,挑选与目标事件发生时间段相同的对象路径数据,根据事件的时空与路径数据的时空分析,建立事件和出现对象的时空关系,找到与时空发生关系的对象,得到关系对<事件编号,对象ID的路径数据>作为样本集合。
根据上述步骤得到的关联度样本数据提取特征,训练随机森林模型,用以计算未分析事件中<事件编号,对象ID的路径数据>的对象与事件的关联度。
可选地,样本对象与样本事件的关联度参数用于表示样本对象是否执行样本事件,关联度样本数据包括正样本数据和负样本数据,步骤S3001获取关联度样本数据,包括:
步骤S30011,确定样本事件和目标样本对象的行为特征信息构成正样本数据,其中,目标样本对象用于表示执行了样本事件的样本对象。
步骤S30012,获取非目标对象,其中,非目标对象用于表示未执行样本事件的样本对象。
步骤S30013,确定样本事件和非目标对象的行为特征信息构成负样本数据。
上述步骤中,由于已分析事件中记录了执行对象的编号,从样本集合中取到事件执行对象ID的路径数据<事件编号,执行对象ID的路径数据>作为正样本数据,另外一些在事件发生地附近出现但并不是执行对象的关系对<事件编号,非执行对象ID的路径数据>作为负样本数据,用于对比对象执行事件时的行为特点。同时包括正样本数据和负样本数据的输入可以使关联度预测模型更加精确。
需要说明的是,关联度预测模型通过学习正样本在路径特征向量和统计特征信息这些特征上的取值分布,以及与负样本的差异,比如负样本大多是常驻对象,不断训练模型,使得模型的预测效果不断完善。
可选地,步骤S30012获取非目标对象,包括:
步骤S300121,从事件数据库中获取已完成的样本事件,并获取发生样本事件的事件时间。
步骤S300122,从路径数据库中获取与事件时间属于同一时间段的路径数据。
步骤S300123,将样本事件与路径数据进行匹配,得到匹配结果,其中,匹配结果中包括与样本事件相关联的对象集合。
一种可选方案中,上述匹配可以为获取样本事件和路径数据库的交际。
步骤S300124,确定对象集合中,除目标对象之外的其他对象为非目标对象。
如前所述,将在事件发生地附近出现但并不是执行对象的关系对<事件编号,非执行对象ID的路径数据>作为负样本数据,可以使关联度预测模型更加精确。
需要说明的是,在一个目标事件中,除了执行对象就是非执行对象,即除了目标对象就是非目标对象。
可选地,在步骤S302获取与目标事件相关联的候选对象的行为特征信息之前,上述方法还包括:步骤S3004,获取候选对象,其中,获取候选对象的步骤包括:
步骤S30041,从路径数据库中获取与目标事件发生的时间属于同一时间段的路径数据。
步骤S30042,将目标事件与路径数据进行匹配,得到匹配结果。
步骤S30043,确定匹配结果中,与目标事件匹配成功的路径数据对应的对象为候选对象。
需要说明的是,候选对象包括了目标对象和关联度参数相对较高的相关对象。
可选地,步骤S30042将目标事件与路径数据进行匹配,得到匹配结果,包括:
步骤S300421,根据目标事件的位置信息点确定匹配范围。
步骤S300422,路径数据发生在匹配范围内,确定轨迹与目标事件相匹配。
在一个可选的实施例中,从事件库取近一年的事件,并区分已分析事件和未分析事件。在已分析事件对应的路径数据库中,取与目标事件相同类型的事件中,相同时间段经过目标事件附近的对象,这些对象即为候选对象。
可选地,步骤S306根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象,包括:
步骤S3061,获取关联度参数阈值。
一种可选方案中,上述关联度参数阈值可以为(0,1)区间的数,上述关联度参数阈值根据目标事件发生的时间、地点、性质等取值不同。例如,如果目标事件发生在繁华的区域,关联度参数阈值相对取值较高,可以为0.8;如果目标事件发生在萧条的区域,关联度参数阈值相对取值较低,可以为0.5;
步骤S3062,将候选对象的关联度参数与关联度参数阈值进行比对。
步骤S3063,确定关联度参数大于关联度参数阈值的候选对象为目标事件的目标对象。
上述步骤中,在通过关联度预测模型得到每一个候选对象的关联度参数之后,将其与关联度参数阈值进行比对,确定关联度参数大于关联度参数阈值的候选对象为目标事件的目标对象,进一步结合目标事件和目标对象的其他信息进行研判分析,从而实现对目标事件的分析。
可选地,步骤S306根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象,包括:
步骤S3064,获取数量阈值N,其中,N为正整数;
步骤S3065,将候选对象按照关联度参数由大至小的顺序排序;
步骤S3066,确定排序结果中的前N个候选对象为目标事件的目标对象。
上述步骤中,在通过关联度预测模型得到每一个候选对象的关联度参数之后,将关联度参数进行排序,确定排序结果中的前N个候选对象为目标事件的目标对象,进一步结合目标事件和目标对象的其他信息进行研判分析,从而实现对目标事件的分析。
可选地,在步骤S308确定了多个目标对象的情况下,在从所有的候选对象中确定与目标事件对应的目标对象之后,上述方法还包括:
步骤S3081,获取多个目标对象的属性信息;
步骤S3082,根据多个目标对象的属性信息,从多个目标对象中筛选出最终的目标对象。
一种可选方案中,目标对象可以为车辆,上述属性信息可以为车辆的车型、颜色等。例如,在目标事件中,经过分析确认目标事件的执行对象为黑色车辆,因此可以排除目标对象中其他颜色的车辆,从而进一步确定目标对象中的黑色车辆为最终的目标对象。
图4为根据本申请实施例1的一种可选的获取对象与事件的关联度的方法流程图,如图4所示,从事件数据库中取近一年的事件,从对应路径数据库中取相同时间段内的对象路径数据,根据事件的时空与路径数据进行时空分析,建立事件和出现对象的时空关系,找到与时空发生关系的对象,采取<事件编号,对象ID的路径数据>的方式,构建对象与事件的关联样本。针对构建好的对象与事件的关联样本,提取路径特征向量和统计特征信息,进而对初始随机森林分类器模型进行训练,得到训练好的关联度预测模型,从而可以预测待分析事件与每一个候选对象的关联度得分,并对其进行排序,筛选出关联度排序较高的目标对象,分析人员结合事件和排序较高的目标对象的其他数据进一步研判分析,完成以事件找对象的分析目标。
通过上述方案,首先获取与目标事件相关联的候选对象的行为特征信息,然后根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和所述样本对象与所述样本事件的关联度参数,最后根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。与现有技术相比,本申请提出了对象与事件的关联度的概念,将已经发生的事件作为样本,训练关联度预测模型,以预测出每一个候选对象的对象与事件的关联度;通过时空共现建立对象和事件的连接关系,然后再计算对象与事件的关联度,达到了确定相关主体的目的,进而解决了相关技术中确定与事件相关的主体的效率较低的技术问题。
需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本申请并不受所描述的动作顺序的限制,因为依据本申请,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本申请所必须的。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如ROM/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,或者网络设备等)执行本申请各个实施例所述的方法。
实施例2
根据本申请实施例,还提供了一种查找目标对象的装置,如图5所示,该装置500包括:获取模块502、预测模块504、和确定模块506。
其中,获取模块502,用于获取与目标事件相关联的候选对象的行为特征信息;预测模块504,用于根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和所述样本对象与样本事件的关联度参数;确定模块506,用于根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。
可选地,行为特征信息包括:路径特征向量和统计特征信息,上述获取模块包括:提取模块,用于通过路径特征提取模型,提取候选对象的路径特征向量;确定子模块,用于确定候选对象在第一时间段内的第一统计特征信息和在第二时间段内的第二统计特征信息之差为统计特征信息,其中,第二时间段用于表示目标事件发生前和/或后的预设时间段,第二时间段小于所述第一时间段。
可选地,确定子模块包括:第一获取模块,用于获取第一时间段内,候选对象在至少一个维度上的第一统计特征信息;第二获取模块,用于获取第二时间段内,候选对象在至少一个维度上的第二统计特征信息;统计特征信息确定模块,用于确定第一统计特征信息和第二统计特征信息的差异值为候选对象的统计特征信息。
可选地,至少一个维度包括:候选对象的移动范围、候选对象的移动轨迹的轨迹熵、候选对象活动地点的数量、候选对象常驻地与目标事件所在地的距离、候选对象所在地与目标事件所在地的平均距离、候选对象在预设时间段内活动地点的数量、候选对象在预设时间段内出现在所述目标事件所在地的时长、所述候选对象出现在所述目标事件所在地的时长或者所述目标事件发生前所述候选对象出现在所述目标事件所在地的时长。
可选地,提取模块包括:序列获取模块,用于获取候选对象的路径点序列;提取子模块,用于通过路径特征提取模型,对路径点序列进行特征提取,得到候选对象的路径特征向量。
可选地,上述装置还包括第一生成模块,用于生成路径特征提取模型,其中,第一生成模块,包括:切分模块,用于切分样本路径,得到连续的多段路径;路径确定模块,用于确定连续的多段路径中,任意一段路径的路径点序列和下一段路径的路径点序列;样本确定模块,用于确定任意一段路径的路径点序列和下一段路径的路径点序列构成路径样本数据;第一训练模块,用于根据路径样本数据对初始神经网络模型进行训练,得到路径特征提取模型。
可选地,上述装置还包括第二生成模块,用于生成关联度预测模型,其中,关联度预测模型为随机森林分类器,第二生成模块包括:第三获取模块,用于获取关联度样本数据;第二训练模块,用于利用关联度样本数据对初始随机森林分类器进行训练,得到关联度预测模型。
可选地,样本对象与样本事件的关联度参数用于表示样本对象是否执行样本事件,关联度样本数据包括正样本数据和负样本数据,第三获取模块包括:正样本确定模块,用于确定目标样本对象的行为特征信息构成正样本数据,其中,目标样本对象用于表示执行了样本事件的样本对象;非目标对象获取模块,用于获取非目标对象,其中,非目标对象用于表示未执行样本事件的样本对象;负样本确定模块,用于确定样本事件和非目标对象的行为特征信息构成负样本数据。
可选地,非目标对象获取模块包括:第四获取模块,用于从事件数据库中获取已完成的样本事件,并获取发生样本事件的事件时间;第五获取模块,用于从路径数据库中获取与事件时间属于同一时间段的路径数据;第一匹配模块,用于将样本事件与路径数据进行匹配,得到匹配结果,其中,匹配结果中包括与样本事件相关联的对象集合;非目标对象确定模块,用于确定对象集合中,除目标对象之外的其他对象为非目标对象。
可选地,上述装置还包括:第六获取模块,用于在获取与目标事件相关联的候选对象的行为特征信息之前,获取候选对象,其中,第六获取模块包括:路径数据获取模块,用于从路径数据库中获取与目标事件发生的时间属于同一时间段的路径数据;第二匹配模块,用于将目标事件与路径数据进行匹配,得到匹配结果;候选对象确定模块,用于确定匹配结果中,与目标事件匹配成功的路径数据对应的对象为候选对象。
可选地,第二匹配模块包括:范围确定模块,用于根据目标事件的位置信息点确定匹配范围;确定子模块,用于路径数据发生在匹配范围内,确定轨迹与目标事件相匹配。
可选地,确定模块包括:第六获取模块,用于获取关联度参数阈值;比对模块,用于将候选对象的关联度参数与关联度参数阈值进行比对;目标对象确定模块,用于确定关联度参数大于关联度参数阈值的候选对象为目标事件的目标对象。
可选地,确定模块包括:第七获取模块,用于获取数量阈值N,其中,N为正整数;排序模块,用于将候选对象按照关联度参数由大至小的顺序排序;关联对象确定模块,用于确定排序结果中的前N个候选对象为目标事件的目标对象。
可选地,上述装置还包括:第七获取模块,用于在确定了多个目标对象的情况下,在从所有的候选对象中确定与目标事件对应的目标对象之后,获取多个目标对象的属性信息;筛选模块,用于根据多个目标对象的属性信息,从多个目标对象中筛选出最终的目标对象。
基于本申请上述实施例提供的方案,首先获取与目标事件相关联的候选对象的行为特征信息,然后根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和样本对象与样本事件的关联度参数,最后根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。与现有技术相比,本申请提出了对象与事件的关联度的概念,将已经发生的事件作为样本,训练关联度预测模型,以预测出每一个候选对象的对象与事件的关联度;通过时空共现建立对象和事件的连接关系,然后再计算对象与事件的关联度,达到了确定相关主体的目的,进而解决了相关技术中确定与事件相关的主体的效率较低的技术问题。
此处需要说明的是,上述获取模块502、预测模块504、和确定模块506对应于实施例1中的步骤S302至步骤S306,三个模块与对应的步骤所实现的实例和应用场景相同,但不限于上述实施例1所公开的内容。需要说明的是,上述模块作为装置的一部分可以运行在实施例1提供的计算设备10中。
实施例3
本申请的实施例可以提供一种计算设备,该计算设备可以是计算设备群中的任意一个计算设备。可选地,在本实施例中,上述计算设备也可以替换为其他终端设备。
可选地,在本实施例中,上述计算设备还可以是图2所示的分布式网络系统中的网络设备之一。
在本实施例中,上述计算设备可以执行应用程序的查找目标对象的方法中以下步骤的程序代码:获取与目标事件相关联的候选对象的行为特征信息;根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和样本对象与样本事件的关联度参数;根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。
可选地,图6是根据本申请实施例的一种计算设备的结构框图。如图6所示,该计算设备A可以包括:一个或多个(图中仅示出一个)处理器102以及存储器104。
其中,存储器可用于存储软件程序以及模块,如本申请实施例中的查找目标对象的方法和装置对应的程序指令/模块,处理器通过运行存储在存储器内的软件程序以及模块,从而执行各种功能应用以及数据处理,即实现上述的查找目标对象的方法。存储器可包括高速随机存储器,还可以包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器可进一步包括相对于处理器远程设置的存储器,这些远程存储器可以通过网络连接至终端A。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
处理器可以通过传输装置调用存储器存储的信息及应用程序,以执行下述步骤:获取与目标事件相关联的候选对象的行为特征信息;根据行为特征信息,基于关联度预测模型预测候选对象与目标事件的关联度参数,其中,关联度预测模型通过对关联度样本数据进行训练得到,关联度样本数据包括:样本事件、样本对象的行为特征信息和所述样本对象与样本事件的关联度参数;根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象。
可选地,上述处理器还可以执行如下步骤的程序代码:行为特征信息包括:路径特征向量和统计特征信息,获取与目标事件相关联的候选对象的行为特征信息,包括:通过路径特征提取模型,提取候选对象的路径特征向量;确定候选对象在第一时间段内的第一统计特征信息和在第二时间段内的第二统计特征信息之差为统计特征信息,其中,第二时间段用于表示目标事件发生前和/或后的预设时间段,第二时间段小于所述第一时间段。
可选地,上述处理器还可以执行如下步骤的程序代码:获取第一时间段内,候选对象在至少一个维度上的第一统计特征信息;获取第二时间段内,候选对象在至少一个维度上的第二统计特征信息;确定第一统计特征信息和第二统计特征信息的差异值为候选对象的统计特征信息。
可选地,上述处理器还可以执行如下步骤的程序代码:至少一个维度包括:候选对象的移动范围、候选对象的移动轨迹的轨迹熵、候选对象活动地点的数量、候选对象常驻地与目标事件所在地的距离、候选对象所在地与目标事件所在地的平均距离、候选对象在预设时间段内活动地点的数量、所述候选对象在所述预设时间段内出现在所述目标事件所在地的时长、所述候选对象出现在所述目标事件所在地的时长或者所述目标事件发生前所述候选对象出现在所述目标事件所在地的时长。
可选地,上述处理器还可以执行如下步骤的程序代码:通过路径特征提取模型,提取候选对象的路径特征向量,包括:获取候选对象的路径点序列;通过路径特征提取模型,对路径点序列进行特征提取,得到候选对象的路径特征向量。
可选地,上述处理器还可以执行如下步骤的程序代码:上述方法还包括:生成路径特征提取模型,其中,生成路径特征提取模型,包括:切分样本路径,得到连续的多段路径;确定连续的多段路径中,任意一段路径的路径点序列和下一段路径的路径点序列;确定任意一段路径的路径点序列和下一段路径的路径点序列构成路径样本数据;根据路径样本数据对初始神经网络模型进行训练,得到路径特征提取模型。
可选地,上述处理器还可以执行如下步骤的程序代码:上述方法还包括:生成关联度预测模型,其中,关联度预测模型为随机森林分类器,生成关联度预测模型的步骤,包括:获取关联度样本数据;利用关联度样本数据对初始随机森林分类器进行训练,得到关联度预测模型。
可选地,上述处理器还可以执行如下步骤的程序代码:样本对象与样本事件的关联度参数用于表示样本对象是否执行样本事件,关联度样本数据包括正样本数据和负样本数据,获取关联度样本数据,包括:确定目标样本对象的行为特征信息构成正样本数据,其中,目标样本对象用于表示执行了样本事件的样本对象;获取非目标对象,其中,非目标对象用于表示未执行样本事件的样本对象;确定样本事件和非目标对象的行为特征信息构成负样本数据。
可选地,上述处理器还可以执行如下步骤的程序代码:获取非目标对象,包括:从事件数据库中获取已完成的样本事件,并获取发生样本事件的事件时间;从路径数据库中获取与事件时间属于同一时间段的路径数据;将样本事件与路径数据进行匹配,得到匹配结果,其中,匹配结果中包括与样本事件相关联的对象集合;确定对象集合中,除目标对象之外的其他对象为非目标对象。
可选地,上述处理器还可以执行如下步骤的程序代码:在获取与目标事件相关联的候选对象的行为特征信息之前,上述方法还包括:获取候选对象,其中,获取候选对象的步骤包括:从路径数据库中获取与目标事件发生的时间属于同一时间段的路径数据;将目标事件与路径数据进行匹配,得到匹配结果;确定匹配结果中,与目标事件匹配成功的路径数据对应的对象为候选对象。
可选地,上述处理器还可以执行如下步骤的程序代码:将目标事件与路径数据进行匹配,得到匹配结果,包括:根据目标事件的位置信息点确定匹配范围;路径数据发生在匹配范围内,确定轨迹与目标事件相匹配。
可选地,上述处理器还可以执行如下步骤的程序代码:根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象,包括:获取关联度参数阈值;将候选对象的关联度参数与关联度参数阈值进行比对;确定关联度参数大于关联度参数阈值的候选对象为目标事件的目标对象。
可选地,上述处理器还可以执行如下步骤的程序代码:根据候选对象与目标事件的关联度参数,确定目标事件对应的目标对象,包括:获取数量阈值N,其中,N为正整数;将候选对象按照关联度参数由大至小的顺序排序;确定排序结果中的前N个候选对象为目标事件的目标对象。
可选地,上述处理器还可以执行如下步骤的程序代码:在确定了多个目标对象的情况下,在从所有的候选对象中确定与目标事件对应的目标对象之后,上述方法还包括:获取多个目标对象的属性信息;根据多个目标对象的属性信息,从多个目标对象中筛选出最终的目标对象。
本领域普通技术人员可以理解,图6所示的结构仅为示意,计算设备也可以是平板电脑、掌声电脑以及移动互联网设备(Mobile Internet Devices,MID)、PAD等终端设备。图6其并不对上述电子装置的结构造成限定。例如,计算设备10还可包括比图6中所示更多或者更少的组件(如网络接口、显示装置等),或者具有与图6所示不同的配置。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:闪存盘、只读存储器(Read-Only Memory,ROM)、随机存取器(RandomAccess Memory,RAM)、磁盘或光盘等。
上述本申请实施例序号仅仅为了描述,不代表实施例的优劣。
在本申请的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
在本申请所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
另外,在本申请各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:U盘、只读存储器(ROM,Read-Only Memory)、随机存取存储器(RAM,Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
以上所述仅是本申请的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本申请原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本申请的保护范围。

Claims (18)

1.一种查找目标对象的方法,其特征在于,包括:
获取与目标事件相关联的候选对象的行为特征信息;
根据所述行为特征信息,基于关联度预测模型预测所述候选对象与目标事件的关联度参数,其中,所述关联度预测模型通过对关联度样本数据进行训练得到,所述关联度样本数据包括:样本事件、样本对象的行为特征信息和所述样本对象与所述样本事件的关联度参数;
根据所述候选对象与所述目标事件的关联度参数,确定所述目标事件对应的目标对象。
2.根据权利要求1所述的方法,其特征在于,所述行为特征信息包括:路径特征向量和统计特征信息,获取与目标事件相关联的候选对象的行为特征信息,包括:
通过路径特征提取模型,提取所述候选对象的所述路径特征向量;
确定所述候选对象在第一时间段内的第一统计特征信息和在第二时间段内的第二统计特征信息之差为所述统计特征信息,其中,所述第二时间段用于表示所述目标事件发生前和/或后的预设时间段,所述第二时间段小于所述第一时间段。
3.根据权利要求2所述的方法,其特征在于,确定所述候选对象在第一时间段内的第一统计特征信息和在第二时间段内的第二统计特征信息之差为所述统计特征信息,包括:
获取所述第一时间段内,所述候选对象在至少一个维度上的第一统计特征信息;
获取所述第二时间段内,所述候选对象在所述至少一个维度上的第二统计特征信息;
确定所述第一统计特征信息和所述第二统计特征信息的差异值为所述候选对象的统计特征信息。
4.根据权利要求3所述的方法,其特征在于,所述至少一个维度包括:所述候选对象的移动范围、所述候选对象的移动轨迹的轨迹熵、所述候选对象活动地点的数量、所述候选对象常驻地与所述目标事件所在地的距离、所述候选对象所在地与所述目标事件所在地的平均距离、所述候选对象在预设时间段内活动地点的数量、所述候选对象在所述预设时间段内出现在所述目标事件所在地的时长、所述候选对象出现在所述目标事件所在地的时长或者所述目标事件发生前所述候选对象出现在所述目标事件所在地的时长。
5.根据权利要求2所述的方法,其特征在于,通过路径特征提取模型,提取所述候选对象的所述路径特征向量,包括:
获取所述候选对象的路径点序列;
通过所述路径特征提取模型,对所述路径点序列进行特征提取,得到所述候选对象的路径特征向量。
6.根据权利要求5所述的方法,其特征在于,所述方法还包括:生成所述路径特征提取模型,其中,生成所述路径特征提取模型,包括:
切分样本路径,得到连续的多段路径;
确定连续的多段路径中,任意一段路径的路径点序列和下一段路径的路径点序列;
确定所述任意一段路径的路径点序列和所述下一段路径的路径点序列构成路径样本数据;
根据所述路径样本数据对初始神经网络模型进行训练,得到所述路径特征提取模型。
7.根据权利要求1所述的方法,其特征在于,所述方法还包括:生成所述关联度预测模型,其中,所述关联度预测模型为随机森林分类器,生成所述关联度预测模型的步骤,包括:
获取所述关联度样本数据;
利用所述关联度样本数据对初始随机森林分类器进行训练,得到所述关联度预测模型。
8.根据权利要求7所述的方法,其特征在于,所述样本对象与所述样本事件的关联度参数用于表示所述样本对象是否执行所述样本事件,所述关联度样本数据包括正样本数据和负样本数据,获取关联度样本数据,包括:
确定所述样本事件和目标样本对象的行为特征信息构成所述正样本数据,其中,所述目标样本对象用于表示执行了所述样本事件的样本对象;
获取非目标对象,其中,所述非目标对象用于表示未执行所述样本事件的样本对象;
确定所述样本事件和所述非目标对象的行为特征信息构成所述负样本数据。
9.根据权利要求8所述的方法,其特征在于,获取非目标对象,包括:
从事件数据库中获取已完成的所述样本事件,并获取发生所述样本事件的事件时间;
从路径数据库中获取与所述事件时间属于同一时间段的路径数据;
将所述样本事件与所述路径数据进行匹配,得到匹配结果,其中,所述匹配结果中包括与所述样本事件相关联的对象集合;
确定所述对象集合中,除所述目标对象之外的其他对象为所述非目标对象。
10.根据权利要求1所述的方法,其特征在于,在获取与目标事件相关联的候选对象的行为特征信息之前,所述方法还包括:获取所述候选对象,其中,获取所述候选对象的步骤包括:
从路径数据库中获取与所述目标事件发生的时间属于同一时间段的路径数据;
将所述目标事件与所述路径数据进行匹配,得到匹配结果;
确定所述匹配结果中,与所述目标事件匹配成功的路径数据对应的对象为所述候选对象。
11.根据权利要求10所述的方法,其特征在于,将所述目标事件与所述路径数据进行匹配,得到匹配结果,包括:
根据所述目标事件的位置信息确定匹配范围;
所述路径数据处于在所述匹配范围内,确定所述路径与所述目标事件相匹配。
12.根据权利要求1所述的方法,其特征在于,根据所述候选对象与所述目标事件的关联度参数,确定所述目标事件对应的目标对象,包括:
获取关联度参数阈值;
将所述候选对象的关联度参数与所述关联度参数阈值进行比对;
确定关联度参数大于所述关联度参数阈值的候选对象为所述目标事件的目标对象。
13.根据权利要求1所述的方法,其特征在于,根据所述候选对象与所述目标事件的关联度参数,确定所述目标事件对应的目标对象,包括:
获取数量阈值N,其中,N为正整数;
将所述候选对象按照关联度参数由大至小的顺序排序;
确定排序结果中的前N个候选对象为所述目标事件的目标对象。
14.根据权利要求1所述的方法,其特征在于,在确定了多个目标对象的情况下,在从所有的候选对象中确定与所述目标事件对应的目标对象之后,所述方法还包括:
获取多个所述目标对象的属性信息;
根据多个所述目标对象的属性信息,从多个所述目标对象中筛选出最终的目标对象。
15.一种查找目标对象的装置,其特征在于,包括:
获取模块,用于获取与目标事件相关联的候选对象的行为特征信息;
预测模块,用于根据所述行为特征信息,基于关联度预测模型预测所述候选对象与目标事件的关联度参数,其中,所述关联度预测模型通过对关联度样本数据进行训练得到,所述关联度样本数据包括:样本事件、样本对象的行为特征信息和所述样本对象与所述样本事件的关联度参数;
确定模块,用于根据所述候选对象与所述目标事件的关联度参数,确定所述目标事件对应的目标对象。
16.根据权利要求15所述的装置,其特征在于,所述行为特征信息包括:路径特征向量和统计特征信息,所述获取模块包括:
提取模块,用于通过路径特征提取模型,提取所述候选对象的所述路径特征向量;
确定子模块,用于确定所述候选对象在第一时间段内的第一统计特征信息和在第二时间段内的第二统计特征信息之差为所述统计特征信息,其中,所述第二时间段用于表示所述目标事件发生前和/或后的预设时间段,所述第二时间段小于所述第一时间段。
17.一种存储介质,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行权利要求1所述的查找目标对象的方法。
18.一种处理器,所述处理器用于运行程序,其中,所述程序运行时执行权利要求1所述的查找目标对象的方法。
CN201911274000.XA 2019-12-12 2019-12-12 查找目标对象的方法和装置 Pending CN112966014A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201911274000.XA CN112966014A (zh) 2019-12-12 2019-12-12 查找目标对象的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201911274000.XA CN112966014A (zh) 2019-12-12 2019-12-12 查找目标对象的方法和装置

Publications (1)

Publication Number Publication Date
CN112966014A true CN112966014A (zh) 2021-06-15

Family

ID=76271104

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201911274000.XA Pending CN112966014A (zh) 2019-12-12 2019-12-12 查找目标对象的方法和装置

Country Status (1)

Country Link
CN (1) CN112966014A (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837472A (zh) * 2021-09-26 2021-12-24 杭州海康威视系统技术有限公司 一种预测事件执行人员的方法和设备
CN114329051A (zh) * 2021-12-31 2022-04-12 腾讯科技(深圳)有限公司 数据信息识别方法、装置、设备、存储介质及程序产品
CN115544215A (zh) * 2022-12-02 2022-12-30 中科雨辰科技有限公司 一种关联对象的获取方法、介质及设备
CN116579499A (zh) * 2023-06-08 2023-08-11 重庆中环建设有限公司 一种公路隧道施工方法及系统

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103703433A (zh) * 2011-05-16 2014-04-02 触摸式有限公司 用户输入预测系统
CN106709047A (zh) * 2017-01-04 2017-05-24 浙江宇视科技有限公司 对象查找方法及装置
CN109145114A (zh) * 2018-08-29 2019-01-04 电子科技大学 基于Kleinberg在线状态机的社交网络事件检测方法
US10402723B1 (en) * 2018-09-11 2019-09-03 Cerebri AI Inc. Multi-stage machine-learning models to control path-dependent processes
CN110263106A (zh) * 2019-06-25 2019-09-20 中国人民解放军国防科技大学 协同舆论欺诈检测方法和装置

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103703433A (zh) * 2011-05-16 2014-04-02 触摸式有限公司 用户输入预测系统
CN106709047A (zh) * 2017-01-04 2017-05-24 浙江宇视科技有限公司 对象查找方法及装置
CN109145114A (zh) * 2018-08-29 2019-01-04 电子科技大学 基于Kleinberg在线状态机的社交网络事件检测方法
US10402723B1 (en) * 2018-09-11 2019-09-03 Cerebri AI Inc. Multi-stage machine-learning models to control path-dependent processes
CN110263106A (zh) * 2019-06-25 2019-09-20 中国人民解放军国防科技大学 协同舆论欺诈检测方法和装置

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
RUIQI ZHAO等: "Labeled Graph Kernel for Behavior Analysis", 《IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE》, 1 August 2016 (2016-08-01) *
杨英杰;刘帅;常德显;: "一种基于关系熵和J量值的网络事件关联模式漂移检测方法", 计算机科学, no. 01, 15 January 2016 (2016-01-15) *

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113837472A (zh) * 2021-09-26 2021-12-24 杭州海康威视系统技术有限公司 一种预测事件执行人员的方法和设备
CN113837472B (zh) * 2021-09-26 2024-03-12 杭州海康威视系统技术有限公司 一种预测事件执行人员的方法和设备
CN114329051A (zh) * 2021-12-31 2022-04-12 腾讯科技(深圳)有限公司 数据信息识别方法、装置、设备、存储介质及程序产品
CN114329051B (zh) * 2021-12-31 2024-03-05 腾讯科技(深圳)有限公司 数据信息识别方法、装置、设备、存储介质及程序产品
CN115544215A (zh) * 2022-12-02 2022-12-30 中科雨辰科技有限公司 一种关联对象的获取方法、介质及设备
CN116579499A (zh) * 2023-06-08 2023-08-11 重庆中环建设有限公司 一种公路隧道施工方法及系统
CN116579499B (zh) * 2023-06-08 2024-01-23 重庆中环建设有限公司 一种公路隧道施工方法及系统

Similar Documents

Publication Publication Date Title
Kaufhold et al. Mitigating information overload in social media during conflicts and crises: Design and evaluation of a cross-platform alerting system
Amalina et al. Blending big data analytics: Review on challenges and a recent study
CN112966014A (zh) 查找目标对象的方法和装置
CN110198310B (zh) 一种网络行为反作弊方法、装置及存储介质
Abdel-Basset et al. A group decision making framework based on neutrosophic VIKOR approach for e-government website evaluation
EP3477906B1 (en) Systems and methods for identifying and mitigating outlier network activity
US10672012B2 (en) Brand personality comparison engine
US11361211B2 (en) Artificial intelligence (AI) based chatbot creation and communication system
Zhong et al. A cyber security data triage operation retrieval system
CN110647631B (zh) 案例推荐的方法及装置、存储介质、处理器
EP3079116A1 (en) System and method for generating recommendations
CN108734184B (zh) 一种对敏感图像进行分析的方法及装置
US20190121808A1 (en) Real-time and adaptive data mining
EP3189449A2 (en) Sentiment rating system and method
Skvortsova et al. A hybrid intelligent system for risk assessment based on unstructured data
Fuertes et al. On the development of advanced parental control tools
CN114371946B (zh) 基于云计算和大数据的信息推送方法及信息推送服务器
US20200380376A1 (en) Artificial Intelligence Based System And Method For Predicting And Preventing Illicit Behavior
He et al. Research on the dynamic monitoring system model of university network public opinion under the big data environment
CN114328277A (zh) 一种软件缺陷预测和质量分析方法、装置、设备及介质
CN112163098A (zh) 一种知识图谱的创建方法、装置、存储介质和服务器
CN114048294B (zh) 相似人群扩展模型训练方法、相似人群扩展方法和装置
CN113961811B (zh) 基于事件图谱的话术推荐方法、装置、设备及介质
CN110020102B (zh) 对象推荐方法、装置、存储介质、处理器和系统
CN114741606A (zh) 企业推荐方法、装置、计算机可读介质及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination