CN112116167A - 数据处理方法、数据处理装置、存储介质和电子设备 - Google Patents

数据处理方法、数据处理装置、存储介质和电子设备 Download PDF

Info

Publication number
CN112116167A
CN112116167A CN202011044380.0A CN202011044380A CN112116167A CN 112116167 A CN112116167 A CN 112116167A CN 202011044380 A CN202011044380 A CN 202011044380A CN 112116167 A CN112116167 A CN 112116167A
Authority
CN
China
Prior art keywords
sub
feature
region
sequence
characteristic
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202011044380.0A
Other languages
English (en)
Inventor
李嘉诚
董建强
佟泽雨
陈道昌
侯广东
王征
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Didi Infinity Technology and Development Co Ltd
Original Assignee
Beijing Didi Infinity Technology and Development Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Didi Infinity Technology and Development Co Ltd filed Critical Beijing Didi Infinity Technology and Development Co Ltd
Priority to CN202011044380.0A priority Critical patent/CN112116167A/zh
Publication of CN112116167A publication Critical patent/CN112116167A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/04Forecasting or optimisation specially adapted for administrative or management purposes, e.g. linear programming or "cutting stock problem"
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q50/00Information and communication technology [ICT] specially adapted for implementation of business processes of specific business sectors, e.g. utilities or tourism
    • G06Q50/10Services
    • G06Q50/26Government or public services

Landscapes

  • Engineering & Computer Science (AREA)
  • Business, Economics & Management (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Health & Medical Sciences (AREA)
  • Tourism & Hospitality (AREA)
  • Strategic Management (AREA)
  • Human Resources & Organizations (AREA)
  • Economics (AREA)
  • General Health & Medical Sciences (AREA)
  • Software Systems (AREA)
  • Biomedical Technology (AREA)
  • General Engineering & Computer Science (AREA)
  • Molecular Biology (AREA)
  • Mathematical Physics (AREA)
  • Evolutionary Computation (AREA)
  • Data Mining & Analysis (AREA)
  • Computational Linguistics (AREA)
  • Development Economics (AREA)
  • Biophysics (AREA)
  • General Business, Economics & Management (AREA)
  • Computing Systems (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Marketing (AREA)
  • Operations Research (AREA)
  • Quality & Reliability (AREA)
  • Entrepreneurship & Innovation (AREA)
  • Game Theory and Decision Science (AREA)
  • Educational Administration (AREA)
  • Primary Health Care (AREA)
  • Image Analysis (AREA)

Abstract

本发明实施例公开了一种数据处理方法、数据处理装置、存储介质和电子设备。本发明实施例在分别获取用于表征目标区域按照不同精度划分得到的子区域集合在预定时间段内的道路分布信息、事件相关信息以及异常事件数量的特征图像序列后,根据用于表征道路分布信息的特征图像序列以及用于表征事件相关信息的特征图像序列获取第四特征序列,并根据用于表征异常事件数量的特征图像序列获取第五特征序列,然后根据不同精度的子区域对应的第四特征序列以及第五特征序列获取目标区域在预测时间段内的异常事件分布情况。通过本发明实施例的方法,可以在无需获取用户信息的情况下较为准确地预测预定地理区域在未来时间段内发生异常事件的概率。

Description

数据处理方法、数据处理装置、存储介质和电子设备
技术领域
本发明涉及计算机技术领域,具体涉及一种数据处理方法、数据处理装置、存储介质和电子设备。
背景技术
随着生活节奏的不断加快,人们的出行频率变得越来越高,因此在出行过程中产生异常事件(例如,交通事故)的频率也变得越来越高。因此对于交通行业相关从业者而言,如何准确及时地预见异常事件的发生十分重要。但现有方式在预测异常事件的发生时通常需要获取当事人信息,不利于当事人的隐私保护。
发明内容
有鉴于此,本发明实施例的目的在于提供一种数据处理方法、数据处理装置、存储介质和电子设备,用于在无需获取用户(也即,当事人)信息的情况下较为准确地预测预定地理区域在未来时间段内发生异常事件的概率。
第一方面,本发明实施例提供了一种数据处理方法,所述方法包括:
获取目标区域对应的多个子区域集合,所述目标区域为预定地理区域,所述子区域集合包括按照对应精度对所述目标区域划分得到的多个子区域,且不同子区域集合对应于不同精度;
获取第一时间段内的多个第一特征图像序列、多个第二特征图像序列以及第三特征图像序列,所述第一特征图像序列包括多个第一特征图像,所述第一特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的道路分布信息,所述第二特征图像序列包括多个第二特征图像,所述第二特征图像拥有表征子区域集合中的各子区域在同一子时间段内的事件相关信息,所述第三特征图像序列包括多个第三特征图像,所述第三特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的异常事件数量;
根据各子区域集合对应的所述第一特征图像序列与第二特征图像序列获取对应子区域集合的第四特征序列;
根据各所述第三特征图像序列获取对应子区域集合的第五特征序列;
基于异常预测模型,根据各子区域集合对应的所述第四特征序列以及所述第五特征序列确定所述目标区域对应的目标特征图像,所述目标特征图像包括多个事件发生数量,所述事件发生数量用于表征预测得到的第二时间段内各目标子区域发生异常事件的数量,所述目标子区域为预定精度的所述子区域集合中的子区域。
根据本发明实施例的第二方面,提供一种数据处理装置,所述装置包括:
集合获取单元,用于获取目标区域对应的多个子区域集合,所述目标区域为预定地理区域,所述子区域集合包括按照对应精度对所述目标区域划分得到的多个子区域,且不同子区域集合对应于不同精度;
特征图像获取单元,用于获取第一时间段内的多个第一特征图像序列、多个第二特征图像序列以及第三特征图像序列,所述第一特征图像序列包括多个第一特征图像,所述第一特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的道路分布信息,所述第二特征图像序列包括多个第二特征图像,所述第二特征图像拥有表征子区域集合中的各子区域在同一子时间段内的事件相关信息,所述第三特征图像序列包括多个第三特征图像,所述第三特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的异常事件数量;
第一特征获取单元,用于根据各子区域集合对应的所述第一特征图像序列与第二特征图像序列获取对应子区域集合的第四特征序列;
第二特征获取单元,用于根据各所述第三特征图像序列获取对应子区域集合的第五特征序列;
预测单元,用于基于异常预测模型,根据各子区域集合对应的所述第四特征序列以及所述第五特征序列确定所述目标区域对应的目标特征图像,所述目标特征图像包括多个事件发生数量,所述事件发生数量用于表征预测得到的第二时间段内各目标子区域发生异常事件的数量,所述目标子区域为预定精度的所述子区域集合中的子区域。
根据本发明实施例的第三方面,提供一种计算机可读存储介质,其上存储计算机程序指令,其中,所述计算机程序指令在被处理器执行时实现如第一方面所述的方法。
根据本发明实施例的第四方面,提供一种电子设备,包括存储器和处理器,其中,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如第一方面所述的方法。
本发明实施例在分别获取用于表征目标区域按照不同精度划分得到的子区域集合在预定时间段内的道路分布信息、事件相关信息以及异常事件数量的特征图像序列后,根据用于表征道路分布信息的特征图像序列以及用于表征事件相关信息的特征图像序列获取第四特征序列,并根据用于表征异常事件数量的特征图像序列获取第五特征序列,然后根据不同精度的子区域对应的第四特征序列以及第五特征序列获取目标区域在预测时间段内的异常事件分布情况。通过本发明实施例的方法,可以在无需获取用户信息的情况下较为准确地预测预定地理区域在未来时间段内发生异常事件的概率。
附图说明
通过以下参照附图对本发明实施例的描述,本发明的上述以及其它目的、特征和优点将更为清楚,在附图中:
图1是本发明第一实施例的数据处理方法的流程图;
图2是本发明第一实施例的方法按照对应精度划分目标区域的示意图;
图3是本发明第一实施例的一种可选的实现方式中获取第四特征序列的流程图;
图4是本发明第一实施例的目标区域的多个子区域集合在同一子时间段内对应的第六特征的示意图;
图5是本发明第一实施例的数据处理方法的流程图;
图6是本发明第二实施例的数据处理装置的示意图;
图7是本发明第三实施例的电子设备的示意图。
具体实施方式
以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分。对本领域技术人员来说没有这些细节部分的描述也可以完全理解本发明。为了避免混淆本发明的实质,公知的方法、过程、流程、元件和电路并没有详细叙述。
此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
除非上下文明确要求,否则在说明书的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
对于交通行业相关从业者而言,如何准确及时地预见异常事件的发生十分重要,准确及时地预测异常事件不仅有利于及时避免至少部分异常事件的发生,降低对于交通状况的负面影响,还可以降低异常事件发生造成的经济损失和人力损失。但现有方式在预测异常事件的发生时通常需要获取当事人(例如,异常事件发生时的驾驶员、乘客等)信息,例如驾驶员的性别、年龄、驾驶年龄等,不利于当事人的隐私保护。
图1是本发明第一实施例的数据处理方法的流程图。如图1所示,本实施例的方法包括如下步骤:
步骤S100,获取目标区域对应的多个子区域集合。
在本实施例中,目标区域为预定地理区域,具体可以为包括道路网络的预定地理区域,目标区域对应的多个子区域集合包括按照对应精度对目标区域划分得到的多个子区域集合,并且各子区域集合对应于不同精度。精度是指目标区域的划分精度,用于限定等间距划分得到的子区域的数量。
以任一精度为例,在本实施例中,目标区域需要按照该精度被划分成M×N(其中,M和N均为大于1的预定整数)个大小相同且互不重叠的子区域,因此本实施例以目标区域为方形区域为例进行说明。但是可选地,目标区域也可以为其他形状的区域,例如多边形区域。
图2是本发明第一实施例的方法按照对应精度划分目标区域的示意图。容易理解,图2所示的区域划分方式仅仅为一种示意,在本实施例中,需要对目标区按照不同精度进行划分。如图2所示,区域21为包括道路网络的预定地理区域,也即目标区域,服务器可以按照对应精度对区域21进行划分,将区域21划分为2×2个子区域,也即子区域211、子区域212、子区域213和子区域214,然后将子区域211、子区域212、子区域213和子区域214确定为区域21对应的一个子区域集合。容易理解,服务器还可以按照其他精度对区域21进行划分,例如,将区域21划分为2×4个子区域、将区域21划分为4×4个子区域等,本实施例不做具体限定。
步骤S200,获取第一时间段内的多个第一特征图像序列、多个第二特征图像序列以及第三特征图像序列。
在获取目标区域对应的多个精度的子区域集合后,服务器可以获取各子区域集合在第一时间段内对应的第一特征图像序列、第二特征图像序列和第三特征图像序列。
在本实施例中,第一特征图像序列包括多个按照时间轴顺序排序的第一特征图像,第一特征图像用于表征对应子区域集合中的各子区域在第一时间段的同一子时间段内的道路分布信息。在本实施例中,子区域通常包括至少一条道路,因此道路分布信息用于表征对应子区域内包括的车辆可行驶道路的位置信息,具体可以为道路的经纬度坐标序列。根据计算配置和实际需求,服务器可以根据预先设置的预定间距获取车辆可行驶道路的坐标序列,例如,每隔0.5米获取一次位置在车辆可行驶道路上的点(例如,道路中心点)的坐标,从而可以得到车辆可行驶道路的坐标序列。车辆可行驶道路是指车辆可以从至少一条道路行驶到该条道路上,若车辆可以从至少一条道路行驶到预定道路上,表示预定道路具有连接关系,为车辆可行驶道路;若车辆无法从任一条道路行驶到预定道路上,表示预定道路不具有连接关系,不属于本实施例的车辆可行驶道路,也即,车辆不可行驶道路。车辆不可行驶道路的道路可以为小区、学校等封闭区域内设置的道路,或者在预定时间段内禁止车辆通行的道路。容易理解,车辆可行驶道路与车辆不可行驶道路之间可以相互转换,因此同一子区域在不同子时间段内的道路分布信息可能不完全相同。
例如,区域A1为目标区域,第一时间段为9:00-12:00,区域A1对应的一个子区域集合包括子区域a1,a1包括道路L1、道路L2、道路L3和道路L4,在子时间段9:00-9:30内,道路L1、道路L2和道路L4为车辆可行驶道路,道路L3为车辆不可行驶道路,服务器可以获取道路L1、道路L2和道路L4的坐标点序列作为子区域a1在9:00-9:30内的道路分布信息。
第二特征图像序列包括多个按照时间轴顺序排序的第二特征图像,第二特征图像用于表征对应子区域集合中的各子区域在第一时间段的同一子时间段内的事件相关信息。在本实施例中,事件相关信息可以包括对应子区域在对应子时间段内发生异常事件的事件发生时刻以及事件发生位置,其中,事件发生位置可以为异常事件发生时的经纬度坐标。
第三特征序列包括多个按照时间轴顺序排序的第三特征图像,第三特征图像用于表征对应子区域集合中的各子区域在第一时间段的同一子时间段内的异常事件数量。例如,在异常事件为交通事故时,异常事件数量用于表征对应子区域在预定子时间段内发生交通事故的总数量。
步骤S300,根据各子区域集合对应的第一特征图像序列与第二特征图像序列获取对应子区域集合的第四特征序列。
在本实施例的一种可选的实现方式中,服务器可以基于预先训练的模型对各第一特征图像序列与对应的第二特征序列进行处理,从而获取对应子区域集合的第四特征序列。图3是本发明第一实施例的一种可选的实现方式中获取第四特征序列的流程图。如图3所示,在本实施例的一种可选的实现方式中,步骤S300可以包括如下步骤:
步骤S310,基于第一特征提取模型对各第一特征图像序列进行特征提取,获取对应子区域集合的第一特征序列。
在本实施例中,第一特征提取模型可以为卷积神经网络(CNN,ConvolutionalNeural Networks)。CNN是一类包含卷积计算且具有深度结构的前馈神经网络,是深度学习的代表算法之一,CNN由多个卷积层构成,每个卷积层包括多个卷积核,卷积核从左向右、从上向下依次扫描第一特征图像序列中的各第一特征图像,从而得到各第一特征图像在各个尺度的抽象表示。在本实施例中,第一特征提取模型处理的图像实际为用于表征目标区域按照不同精度划分得到的各子区域集合在第一时间段的各子时间段内的道路分布信息的图像序列,因此服务器可以基于第一特征提取模型对各第一特征图像序列进行特征提取,从而获取对应子区域集合的第一特征序列。
具体地,服务器可以分别以各第一特征图像序列为第一特征提取模型的输入,基于第一特征提取模型进行特征提取,获取对应子区域集合的第一特征序列。在本实施例中,第一特征序列为对应子区域集合的第一特征图像序列的低维特征表示。
步骤S320,基于第二特征提取模型对各第二特征图像序列进行特征提取,获取对应子区域集合的第二特征序列。
在本实施例中,第二特征提取模型同样可以为CNN。在本实施例中,第二特征提取模型处理的图像实际为用于表征目标区域按照不同精度划分得到的子区域集合在第一时间段的各子时间段内的事件相关信息的图像序列,因此服务器可以基于第二特征提取模型对各第二特征图像进行特征提取,从而获取对应子区域集合的第二特征序列。
具体地,服务器可以分别以各第二特征图像序列为第二特征提取模型的输入,基于第二特征提取模型进行特征提取,获取对应子区域集合的第二特征序列。在本实施例中,第二特征序列为对应子区域集合的第二特征图像序列的低维特征表示。
容易理解,在本实施例的一种可选的实现方式中,步骤S310和步骤S320可以同时执行,也可以先后执行,本实施例不做具体限定。
步骤S330,基于特征整合模型,根据各子区域集合对应的第一特征序列与第二特征序列获取对应子区域集合的第三特征序列。
在得到各子区域集合对应的第一特征序列以及第二特征序列后,服务器可以分别以同一子区域集合对应的第一特征序列与第二特征序列为特征整合模型的输入,从而得到该子区域集合对应的第三特征序列。
在本实施例中,特征整合模型为全连接神经网络。全连接神经网络包括多个全连接层,全连接层中的每个神经元与其前一层的所有神经元全部链接,因此全连接神经网络可以整合第一特征序列与第二特征序列中具有类别区分性的局部信息。具体地,特征整合模型可以为全连接的CNN、全连接的RNN等,本实施例不做具体限定。
步骤S340,基于第一编码模型对各第三特征序列进行编码处理,获取对应子区域集合的第四特征序列。
在得到各子区域集合对应的第三特征序列后,服务器可以基于第一编码模型对各第三特征序列进行编码处理,获取对应子区域集合的第四特征序列。在本实施例中,第一编码模型可以为人工神经网络,具体可以为循环神经网络(RNN,Recurrent NeuralNetwork)。人工神经网络在图像(也即,第三特征序列中的各个特征)编码方面具有良好的容错性、自组织性和自适应性,不必借助于预定的数据编码算法,可以根据图像本身的特性自主对图像进行编码。
步骤S400,根据各第三特征图像序列获取对应子区域集合的第五特征序列。
在本步骤中,服务器可以基于第二编码模型对各第三特征图像序列进行编码处理,获取对应子区域集合的第五特征序列。在本实施例中,第二编码模型同样可以为人工神经网络,具体可以为RNN。
步骤S500,基于异常预测模型,根据各子区域集合对应的第四特征序列以及第五特征序列确定目标区域对应的目标特征图像。
在得到第四特征序列以及第五特征序列后,服务器可以基于异常预测模型,确定用于表征目标区域的各目标子区域在第二时间段内发生异常事件的数量的目标特征图像。其中,目标子区域为按照预定精度划分目标区域得到的子区域集合中的子区域。因此,目标特征图像可以用于反映目标区域在第二时间段内异常事件的分布情况。
在本步骤中,服务器可以首先将各子区域集合对应的第四特征序列以及第五特征序列进行拼接,得到对应子区域集合的第六特征序列。具体地,对于各子区域集合,服务器可以将对应的第四特征序列与第五特征序列在第一时间段的同一子时间段内产生的第四特征以及第五特征进行拼接,得到第六特征,然后根据各第六特征以及对应的时间轴顺序确定各子区域集合对应的第六特征序列。
在得到各子区域集合对应的第六特征序列后,服务器可以将各第六特征序列中同一子时间段对应的特征进行拼接,获取第七特征序列。具体地,服务器可以确定任一子区域集合对应的第六特征序列,以最高精度的子区域集合为例,对于该子区域集合中的各子区域,服务器可以获取包括该子区域的各子区域在同一子时间段的特征,然后将该子区域以及包括该子区域的各子区域在同一子时间段的特征进行拼接,作为该子区域对应的子特征,然后根据各子区域在同一子时间段对应的子特征确定各子时间段对应的第七特征,从而根据各第七特征以及对应的时间轴顺序确定第七特征序列。
容易理解,在本实施例中,第一特征序列、第二特征序列、第三特征序列、第四特征序列、第五特征序列、第六特征序列以及第七特征序列均为特征图像序列。
图4是本发明第一实施例的目标区域的多个子区域集合在同一子时间段内对应的第六特征的示意图。容易理解,图4所示的区域划分方式仅仅是示意性的。如图4所示,图像41为子区域集合C1在同一子时间段内的特征图像,也即第六特征F1,图像42为子区域集合C2在该子时间段内的特征图像,也即第六特征F2,图像43为子区域集合C3在该子时间段内的特征图像,也即第六特征F3。其中,图像41包括子区域44对应的特征,也即特征f1,图像42包括子区域45对应的特征,也即特征f2,图像43包括子区域46对应的特征,也即特征f3,且子区域44和子区域45均为包括子区域46的子区域。服务器可以将特征f1、特征f2和特征f3进行拼接,作为子区域41在该子时间段对应的子特征,然后根据子区域集合43内的各子区域在该子时间段对应的子特征确定目标区域在该子时间段对应的第七特征,从而根据各第七特征确定目标区域在第一时间段内的第七特征序列。
在确定目标区域在第一时间段内的第七特征序列后,服务器可以以第七特征序列为异常预测模型的输入,确定目标区域在第二时间段内的目标特征图像。
在本实施例中,第一特征提取模型、第二特征提取模型、特征整合模型、第一编码模型、第二编码模型以及异常预测模型的训练方式可以为端到端的训练方式,也就是说,服务器可以基于训练样本对第一特征提取模型、第二特征提取模型、特征整合模型、第一编码模型、第二编码模型以及异常预测模型同时进行训练。在本实施例中,训练样本可以包括多个区域的历史区域属性特征,历史区域属性特征具体可以包括对应区域中的多个子区域集合在第一历史时间段的同一历史子时间段内的道路分布信息、历史事件相关信息、历史异常事件数量以及预定精度的子区域集合在第二历史时间段对应的事件数量集合。与目标区域对应的子区域集合相似,区域的子区域集合同样包括按照对应精度对对应区域划分得到的多个子区域,且同一区域对应的不同子区域集合对应于不同精度,且事件数量集合包括预定精度的子区域集合内各子区域对应的历史事件发生数量,历史事件量用于表征对应子区域在第二历史时间段内实际发生异常事件的数量。
容易理解,训练样本中的道路分布信息以及历史事件相关信息包括的信息与目标区域对应的道路分布信息以及事件相关信息所包含的信息类别和数量是相同的,且上述多个区域与目标区域的区域划分方式相同。
在第一特征提取模型、第二特征提取模型、特征整合模型、第一编码模型、第二编码模型以及异常预测模型的训练过程中,服务器可以分别将各区域的子区域集合在第一历史时间段内的道路分布信息转化为第一历史特征图像序列,将各区域的子区域集合在第一历史时间段内的历史事件相关信息转化为第二历史特征图像序列,将各区域的子区域集合在第一历史时间段内的历史异常事件数量转化为第三历史特征图像序列,将各区域预定精度的子区域集合在第二历史时间段内的时间数量集合转化为历史特征图像,然后将同一区域对应的第一历史特征图像序列作为第一特征提取模型的输入、将第二历史特征图像作为第二特征提取模型的输入、将第三历史特征图像序列作为第二编码模型的输入、将该区域对应的历史特征图像为训练目标。
图5是本发明第一实施例的数据处理方法的流程图。如图5所示,服务器在获取目标区域对应的多个子区域集合在第一时间段内的第一特征图像序列:图像序列L11-图像序列L1n(其中,n为大于等于1的预定整数)、第二特征图像序列:图像序列L21-图像序列L2N以及第三特征图像序列:图像序列L31-图像序列L3n,然后将图像序列L11-图像序列L1n输入第一特征提取模型51,得到图像序列L1i(其中,i为大于等于1且小于等于n的预定整数)对应的第一特征序列L4i,同时,服务器可以将图像序列L21-图像序列L2N输入第二特征提取模型52,得到图像序列L2i对应的第二特征序列L5i,并将图像序列L31-图像序列L3n输入第二编码模型53,得到图像序列L3i对应的第五特征序列L6i。然后,服务器可以将第一特征序列L4i与第二特征序列L5i作为特征整合模型54的输入,得到第三特征序列L7i。进而将第三特征序列L71-第三特征序列L7n作为第一编码模型55的输入,得到第三特征序列L7i对应的第四特征序列L8i。然后根据第四特征序列L81-第四特征序列L8n以及第五特征序列L61-第五特征序列L6n得到第七特征序列,从而将目标区域对应的第七特征序列作为异常预测模型56的输入,得到目标区域对应的目标特征图像。
本实施例在分别获取用于表征目标区域按照不同精度划分得到的子区域集合在预定时间段内的道路分布信息、事件相关信息以及异常事件数量的特征图像序列后,根据用于表征道路分布信息的特征图像序列以及用于表征事件相关信息的特征图像序列获取第四特征序列,并根据用于表征异常事件数量的特征图像序列获取第五特征序列,然后根据不同精度的子区域对应的第四特征序列以及第五特征序列获取目标区域在预测时间段内的异常事件分布情况。通过本实施例的方法,可以在无需获取用户信息的情况下较为准确地预测预定地理区域在未来时间段内发生异常事件的概率。
图6是本发明第二实施例的数据处理装置的示意图。如图6所示,本实施例的装置包括集合获取单元61、特征图像获取单元62、第一特征获取单元63、第二特征获取单元64和预测单元65。
其中,集合获取单元61用于获取目标区域对应的多个子区域集合,所述目标区域为预定地理区域,所述子区域集合包括按照对应精度对所述目标区域划分得到的多个子区域,且不同子区域集合对应于不同精度。特征图像获取单元62用于获取第一时间段内的多个第一特征图像序列、多个第二特征图像序列以及第三特征图像序列,所述第一特征图像序列包括多个第一特征图像,所述第一特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的道路分布信息,所述第二特征图像序列包括多个第二特征图像,所述第二特征图像拥有表征子区域集合中的各子区域在同一子时间段内的事件相关信息,所述第三特征图像序列包括多个第三特征图像,所述第三特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的异常事件数量。第一特征获取单元63用于根据各子区域集合对应的所述第一特征图像序列与第二特征图像序列获取对应子区域集合的第四特征序列。第二特征获取单元64用于根据各所述第三特征图像序列获取对应子区域集合的第五特征序列。预测单元65用于基于异常预测模型,根据各所述第四特征序列以及对应精度的第五特征序列确定所述目标区域对应的目标特征图像,所述目标特征图像包括多个事件发生数量,所述事件发生数量用于表征预测得到的第二时间段内各目标子区域发生异常事件的数量,所述目标子区域为预定精度的所述子区域集合中的子区域。
进一步地,所述第一特征获取单元63包括第一特征获取子单元、第二特征提取子单元、特征整合子单元和编码子单元。
其中,第一特征获取子单元用于基于第一特征提取模型对各所述第一特征图像序列进行特征提取,获取对应子区域集合的第一特征序列。第二特征提取子单元用于基于第二特征提取模型对各所述第二特征图像序列进行特征提取,获取对应子区域集合的第二特征序列。特征整合子单元用于基于特征整合模型,根据各子区域集合对应的所述第一特征序列与所述第二特征序列获取对应子区域集合的第三特征序列。编码子单元用于基于第一编码模型对各所述第三特征序列进行编码处理,获取对应子区域集合的所述第四特征序列。
进一步地,所述第二特征获取单元64用于基于第二编码模型对各所述第三特征图像序列进行编码处理,获取对应精度的所述第五特征序列。
进一步地,所述预测单元65包括第一拼接子单元、第二拼接子单元和预测子单元。
其中,第一拼接子单元用于将各子区域集合对应的所述第四特征序列以及第五特征序列进行拼接,获取对应子区域集合的第六特征序列。第二拼接子单元用于将各所述第六特征序列中同一子时间段对应的特征进行拼接,获取第七特征序列。预测子单元用于以所述第七特征序列为所述异常预测模型的输入,获取所述目标特征图像。
进一步地,所述第一特征提取模型、所述第二特征提取模型、所述特征整合模型、所述第一编码模型、所述第二编码模型以及所述异常预测模型基于训练样本同时训练获得,所述训练样本包括多个区域的历史区域属性特征,所述区域属性特征包括对应区域中多个子区域集合在第一历史时间段的同一历史子时间段内的历史道路分布信息、历史事件相关信息、历史异常事件数量以及预定精度的子区域集合在第二历史时间段对应的事件数量集合,所述子区域集合包括按照对应精度对对应区域划分得到的多个子区域,且不同子区域集合对应于不同精度,所述事件数量集合包括所述预定精度的子区域集合内各子区域对应的历史事件发生数量,所述历史事件发生数量用于表征对应子区域在第二历史时间段内实际发生异常事件的数量。
本实施例在分别获取用于表征目标区域按照不同精度划分得到的子区域集合在预定时间段内的道路分布信息、事件相关信息以及异常事件数量的特征图像序列后,根据用于表征道路分布信息的特征图像序列以及用于表征事件相关信息的特征图像序列获取第四特征序列,并根据用于表征异常事件数量的特征图像序列获取第五特征序列,然后根据不同精度的子区域对应的第四特征序列以及第五特征序列获取目标区域在预测时间段内的异常事件分布情况。通过本实施例的装置,可以在无需获取用户信息的情况下较为准确地预测预定地理区域在未来时间段内发生异常事件的概率。
图7是本发明第三实施例的电子设备的示意图。图7所示的电子设备为通用数据处理装置,其包括通用的计算机硬件结构,其至少包括处理器71和存储器72。处理器71和存储器72通过总线73连接。存储器72适于存储处理器71可执行的指令或程序。处理器71可以是独立的微处理器,也可以是一个或者多个微处理器集合。由此,处理器71通过执行存储器72所存储的命令,从而执行如上所述的本发明实施例的方法流程实现对于数据的处理和对于其他装置的控制。总线73将上述多个组件连接在一起,同时将上述组件连接到显示控制器74和显示装置以及输入/输出(I/O)装置75。输入/输出(I/O)装置75可以是鼠标、键盘、调制解调器、网络接口、触控输入装置、体感输入装置、打印机以及本领域公知的其他装置。典型地,输入/输出(I/O)装置75通过输入/输出(I/O)控制器76与系统相连。
其中,存储器72可以存储软件组件,例如操作系统、通信模块、交互模块以及应用程序。以上所述的每个模块和应用程序都对应于完成一个或多个功能和在发明实施例中描述的方法的一组可执行程序指令。
上述根据本发明实施例的方法、设备(系统)和计算机程序产品的流程图和/或框图描述了本发明的各个方面。应理解,流程图和/或框图的每个块以及流程图图例和/或框图中的块的组合可以由计算机程序指令来实现。这些计算机程序指令可以被提供至通用计算机、专用计算机或其它可编程数据处理设备的处理器,以产生机器,使得(经由计算机或其它可编程数据处理设备的处理器执行的)指令创建用于实现流程图和/或框图块或块中指定的功能/动作的装置。
同时,如本领域技术人员将意识到的,本发明实施例的各个方面可以被实现为系统、方法或计算机程序产品。因此,本发明实施例的各个方面可以采取如下形式:完全硬件实施方式、完全软件实施方式(包括固件、常驻软件、微代码等)或者在本文中通常可以都称为“电路”、“模块”或“系统”的将软件方面与硬件方面相结合的实施方式。此外,本发明的方面可以采取如下形式:在一个或多个计算机可读介质中实现的计算机程序产品,计算机可读介质具有在其上实现的计算机可读程序代码。
可以利用一个或多个计算机可读介质的任意组合。计算机可读介质可以是计算机可读信号介质或计算机可读存储介质。计算机可读存储介质可以是如(但不限于)电子的、磁的、光学的、电磁的、红外的或半导体系统、设备或装置,或者前述的任意适当的组合。计算机可读存储介质的更具体的示例(非穷尽列举)将包括以下各项:具有一根或多根电线的电气连接、便携式计算机软盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或闪速存储器)、光纤、便携式光盘只读存储器(CD-ROM)、光存储装置、磁存储装置或前述的任意适当的组合。在本发明实施例的上下文中,计算机可读存储介质可以为能够包含或存储由指令执行系统、设备或装置使用的程序或结合指令执行系统、设备或装置使用的程序的任意有形介质。
计算机可读信号介质可以包括传播的数据信号,所述传播的数据信号具有在其中如在基带中或作为载波的一部分实现的计算机可读程序代码。这样的传播的信号可以采用多种形式中的任何形式,包括但不限于:电磁的、光学的或其任何适当的组合。计算机可读信号介质可以是以下任意计算机可读介质:不是计算机可读存储介质,并且可以对由指令执行系统、设备或装置使用的或结合指令执行系统、设备或装置使用的程序进行通信、传播或传输。
用于执行针对本发明各方面的操作的计算机程序代码可以以一种或多种编程语言的任意组合来编写,所述编程语言包括:面向对象的编程语言如Java、Smalltalk、C++、PHP、Python等;以及常规过程编程语言如“C”编程语言或类似的编程语言。程序代码可以作为独立软件包完全地在用户计算机上、部分地在用户计算机上执行;部分地在用户计算机上且部分地在远程计算机上执行;或者完全地在远程计算机或服务器上执行。在后一种情况下,可以将远程计算机通过包括局域网(LAN)或广域网(WAN)的任意类型的网络连接至用户计算机,或者可以与外部计算机进行连接(例如通过使用因特网服务供应商的因特网)。
以上所述仅为本发明的优选实施例,并不用于限制本发明,对于本领域技术人员而言,本发明可以有各种改动和变化。凡在本发明的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。

Claims (12)

1.一种数据处理方法,其特征在于,所述方法包括:
获取目标区域对应的多个子区域集合,所述目标区域为预定地理区域,所述子区域集合包括按照对应精度对所述目标区域划分得到的多个子区域,且不同子区域集合对应于不同精度;
获取第一时间段内的多个第一特征图像序列、多个第二特征图像序列以及第三特征图像序列,所述第一特征图像序列包括多个第一特征图像,所述第一特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的道路分布信息,所述第二特征图像序列包括多个第二特征图像,所述第二特征图像拥有表征子区域集合中的各子区域在同一子时间段内的事件相关信息,所述第三特征图像序列包括多个第三特征图像,所述第三特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的异常事件数量;
根据各子区域集合对应的所述第一特征图像序列与第二特征图像序列获取对应子区域集合的第四特征序列;
根据各所述第三特征图像序列获取对应子区域集合的第五特征序列;
基于异常预测模型,根据各子区域集合对应的所述第四特征序列以及所述第五特征序列确定所述目标区域对应的目标特征图像,所述目标特征图像包括多个事件发生数量,所述事件发生数量用于表征预测得到的第二时间段内各目标子区域发生异常事件的数量,所述目标子区域为预定精度的所述子区域集合中的子区域。
2.根据权利要求1所述的方法,其特征在于,所述根据各子区域集合对应的所述第一特征图像序列与第二特征图像序列获取对应子区域集合的第四特征序列包括:
基于第一特征提取模型对各所述第一特征图像序列进行特征提取,获取对应子区域集合的第一特征序列;
基于第二特征提取模型对各所述第二特征图像序列进行特征提取,获取对应子区域集合的第二特征序列;
基于特征整合模型,根据各子区域集合对应的所述第一特征序列与所述第二特征序列获取对应子区域集合的第三特征序列;
基于第一编码模型对各所述第三特征序列进行编码处理,获取对应子区域集合的所述第四特征序列。
3.根据权利要求1所述的方法,其特征在于,所述根据各所述第三特征图像序列获取第五特征序列包括:
基于第二编码模型对各所述第三特征图像序列进行编码处理,获取对应子区域集合的所述第五特征序列。
4.根据权利要求1所述的方法,其特征在于,所述基于异常预测模型,根据各子区域集合对应的所述第四特征序列以及所述第五特征序列确定所述目标区域对应的目标特征图像包括:
将各子区域集合对应的所述第四特征序列以及第五特征序列进行拼接,获取对应子区域集合的第六特征序列;
将各所述第六特征序列中同一子时间段对应的特征进行拼接,获取第七特征序列;
以所述第七特征序列为所述异常预测模型的输入,获取所述目标特征图像。
5.根据权利要求1所述的方法,其特征在于,所述第一特征提取模型、所述第二特征提取模型、所述特征整合模型、所述第一编码模型、所述第二编码模型以及所述异常预测模型基于训练样本同时训练获得,所述训练样本包括多个区域的历史区域属性特征,所述区域属性特征包括对应区域中多个子区域集合在第一历史时间段的同一历史子时间段内的历史道路分布信息、历史事件相关信息、历史异常事件数量以及预定精度的子区域集合在第二历史时间段对应的事件数量集合,所述子区域集合包括按照对应精度对对应区域划分得到的多个子区域,且不同子区域集合对应于不同精度,所述事件数量集合包括所述预定精度的子区域集合内各子区域对应的历史事件发生数量,所述历史事件发生数量用于表征对应子区域在第二历史时间段内实际发生异常事件的数量。
6.一种数据处理装置,其特征在于,所述装置包括:
集合获取单元,用于获取目标区域对应的多个子区域集合,所述目标区域为预定地理区域,所述子区域集合包括按照对应精度对所述目标区域划分得到的多个子区域,且不同子区域集合对应于不同精度;
特征图像获取单元,用于获取第一时间段内的多个第一特征图像序列、多个第二特征图像序列以及第三特征图像序列,所述第一特征图像序列包括多个第一特征图像,所述第一特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的道路分布信息,所述第二特征图像序列包括多个第二特征图像,所述第二特征图像拥有表征子区域集合中的各子区域在同一子时间段内的事件相关信息,所述第三特征图像序列包括多个第三特征图像,所述第三特征图像用于表征对应子区域集合中的各子区域在同一子时间段内的异常事件数量;
第一特征获取单元,用于根据各子区域集合对应的所述第一特征图像序列与第二特征图像序列获取对应子区域集合的第四特征序列;
第二特征获取单元,用于根据各所述第三特征图像序列获取对应子区域集合的第五特征序列;
预测单元,用于基于异常预测模型,根据各子区域集合对应的所述第四特征序列以及所述第五特征序列确定所述目标区域对应的目标特征图像,所述目标特征图像包括多个事件发生数量,所述事件发生数量用于表征预测得到的第二时间段内各目标子区域发生异常事件的数量,所述目标子区域为预定精度的所述子区域集合中的子区域。
7.根据权利要求6所述的装置,其特征在于,所述第一特征获取单元包括:
第一特征获取子单元,用于基于第一特征提取模型对各所述第一特征图像序列进行特征提取,获取对应子区域集合的第一特征序列;
第二特征提取子单元,用于基于第二特征提取模型对各所述第二特征图像序列进行特征提取,获取对应子区域集合的第二特征序列;
特征整合子单元,用于基于特征整合模型,根据各子区域集合对应的所述第一特征序列与所述第二特征序列获取对应子区域集合的第三特征序列;
编码子单元,用于基于第一编码模型对各所述第三特征序列进行编码处理,获取对应子区域集合的所述第四特征序列。
8.根据权利要求6所述的装置,其特征在于,所述第二特征获取单元用于基于第二编码模型对各所述第三特征图像序列进行编码处理,获取对应子区域集合的所述第五特征序列。
9.根据权利要求6所述的装置,其特征在于,所述预测单元包括:
第一拼接子单元,用于将各子区域集合对应的所述第四特征序列以及第五特征序列进行拼接,获取对应子区域集合的第六特征序列;
第二拼接子单元,用于将各所述第六特征序列中同一子时间段对应的特征进行拼接,获取第七特征序列;
预测子单元,用于以所述第七特征序列为所述异常预测模型的输入,获取所述目标特征图像。
10.根据权利要求6所述的装置,其特征在于,所述第一特征提取模型、所述第二特征提取模型、所述特征整合模型、所述第一编码模型、所述第二编码模型以及所述异常预测模型基于训练样本同时训练获得,所述训练样本包括多个区域的历史区域属性特征,所述区域属性特征包括对应区域中多个子区域集合在第一历史时间段的同一历史子时间段内的历史道路分布信息、历史事件相关信息、历史异常事件数量以及预定精度的子区域集合在第二历史时间段对应的事件数量集合,所述子区域集合包括按照对应精度对对应区域划分得到的多个子区域,且不同子区域集合对应于不同精度,所述事件数量集合包括所述预定精度的子区域集合内各子区域对应的历史事件发生数量,所述历史事件发生数量用于表征对应子区域在第二历史时间段内实际发生异常事件的数量。
11.一种计算机可读存储介质,其上存储计算机程序指令,其特征在于,所述计算机程序指令在被处理器执行时实现如权利要求1-5中任一项所述的方法。
12.一种电子设备,包括存储器和处理器,其特征在于,所述存储器用于存储一条或多条计算机程序指令,其中,所述一条或多条计算机程序指令被所述处理器执行以实现如权利要求1-5中任一项所述的方法。
CN202011044380.0A 2020-09-28 2020-09-28 数据处理方法、数据处理装置、存储介质和电子设备 Pending CN112116167A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011044380.0A CN112116167A (zh) 2020-09-28 2020-09-28 数据处理方法、数据处理装置、存储介质和电子设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011044380.0A CN112116167A (zh) 2020-09-28 2020-09-28 数据处理方法、数据处理装置、存储介质和电子设备

Publications (1)

Publication Number Publication Date
CN112116167A true CN112116167A (zh) 2020-12-22

Family

ID=73797766

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011044380.0A Pending CN112116167A (zh) 2020-09-28 2020-09-28 数据处理方法、数据处理装置、存储介质和电子设备

Country Status (1)

Country Link
CN (1) CN112116167A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114399344A (zh) * 2022-03-24 2022-04-26 北京骑胜科技有限公司 数据处理方法和数据处理装置

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106080590A (zh) * 2016-06-12 2016-11-09 百度在线网络技术(北京)有限公司 车辆控制方法和装置以及决策模型的获取方法和装置
CN108269397A (zh) * 2017-12-27 2018-07-10 深圳市元征软件开发有限公司 一种道路交通数据的处理方法及车载设备
CN109697852A (zh) * 2019-01-23 2019-04-30 吉林大学 基于时序交通事件的城市道路拥堵程度预测方法

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN106080590A (zh) * 2016-06-12 2016-11-09 百度在线网络技术(北京)有限公司 车辆控制方法和装置以及决策模型的获取方法和装置
CN108269397A (zh) * 2017-12-27 2018-07-10 深圳市元征软件开发有限公司 一种道路交通数据的处理方法及车载设备
CN109697852A (zh) * 2019-01-23 2019-04-30 吉林大学 基于时序交通事件的城市道路拥堵程度预测方法

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN114399344A (zh) * 2022-03-24 2022-04-26 北京骑胜科技有限公司 数据处理方法和数据处理装置

Similar Documents

Publication Publication Date Title
CN108921200B (zh) 用于对驾驶场景数据进行分类的方法、装置、设备和介质
CN107038478B (zh) 路况预测方法及装置、计算机设备与可读介质
CN111656140B (zh) 预测交通事故发生地的人工智能系统和方法
CN112734808B (zh) 一种车辆行驶环境下易受伤害道路使用者的轨迹预测方法
CN110533239B (zh) 一种智慧城市空气品质高精度测量方法
CN106909901A (zh) 从图像中检测物体的方法及装置
CN113159403B (zh) 路口行人轨迹预测的方法及装置
CN112434260A (zh) 一种公路的交通状态检测方法、装置、存储介质及终端
CN113423063A (zh) 基于车载t-box的车辆监控方法、装置、车辆及介质
DE102015207978B3 (de) Analyse der Belegung von grid-basierten Umfeldkarten eines Fahrzeugs
CN112116167A (zh) 数据处理方法、数据处理装置、存储介质和电子设备
CN113869599A (zh) 鱼类疫病发展预测方法、系统、设备及介质
KR102318801B1 (ko) 운전자의 교통사고율 예측 시스템
US20230177959A1 (en) Vehicle accident prediction system, vehicle accident prediction method, vehicle accident prediction program, and learned model creation system
CN113409393B (zh) 用于识别交通标志牌的方法及装置
CN111613052B (zh) 一种交通状况确定方法、装置、电子设备及存储介质
CN116189425A (zh) 一种基于车联网大数据的交通路况预测方法及系统
CN115829237A (zh) 交通运输工具调动方法、装置、设备、介质及产品
CN114218504A (zh) 阻断路段识别方法、装置、电子设备及存储介质
CN113609947A (zh) 运动轨迹预测方法、装置、计算机设备和存储介质
CN106781470B (zh) 城市道路的运行速度的处理方法及装置
CN116469013B (zh) 道路积水预测方法、装置、计算机设备及存储介质
US20230281977A1 (en) Semantic image capture fault detection
CN116558541B (zh) 模型训练方法和装置、轨迹预测方法和装置
CN112101279B (zh) 目标物异常检测方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned
AD01 Patent right deemed abandoned

Effective date of abandoning: 20220401