CN114581252B

CN114581252B - 目标案件的预测方法和装置、电子设备、存储介质

Info

Publication number: CN114581252B
Application number: CN202210210179.8A
Authority: CN
Inventors: 李朝洋
Original assignee: Ping An Technology Shenzhen Co Ltd
Current assignee: Ping An Technology Shenzhen Co Ltd
Priority date: 2022-03-03
Filing date: 2022-03-03
Publication date: 2024-04-05
Anticipated expiration: 2042-03-03
Also published as: CN114581252A

Abstract

本实施例涉及人工智能技术领域，尤其涉及一种目标案件的预测方法和装置、电子设备、存储介质。该目标案件的预测方法包括：对待测区域进行时空粒度划分，得到多个时空标记点；每一时空标记点包括一对时间粒度和空间粒度；获取每一时空标记点的原始数据；将每一原始数据输入到分布预测模型中进行预测处理，得到对应的初步分布结果；将初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取整分布结果；对取整分布结果进行计算处理，得到目标分布结果。本申请实施例的技术方案，能够提高预测目标案件的准确性。

Description

目标案件的预测方法和装置、电子设备、存储介质

技术领域

本申请涉及人工智能技术领域，尤其涉及一种目标案件的预测方法和装置、电子设备、存储介质。

背景技术

随着人工智能科技的迅速发展，目标预测得到了广泛的应用。例如在保险公司的应用场景下，保险公司需要对案件进行预测，以掌握车辆保险案件的分布情况，以便于相关业务提前制定好相关执行方案，例如，提前规划好救援路线和救援方案。

相关技术中，采用时间序列或者回归预测等方式进行历史保险案件分布规律的捕捉，从而实现对目标案件数量的预测，然后从空间和时间上取目标案件数量的平均值作为待测区域的时间和空间上的具体分布。然而，案件通常不遵循均匀分布的规律，因此，这种捕捉案件分布规律的方式不准确。

发明内容

本申请实施例的主要目的在于提出一种目标案件的预测方法和装置、电子设备、存储介质，能够提高预测目标案件的准确性。

为实现上述目的，本申请实施例的第一方面提出了一种目标案件的预测方法，包括：

对待测区域进行时空粒度划分，得到多个时空标记点；每一所述时空标记点包括一对时间粒度和空间粒度；

获取每一所述时空标记点的原始数据；

将每一所述原始数据输入到分布预测模型中进行预测处理，得到对应的初步分布结果；

将所述初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取整分布结果；其中，所述取整分布结果包括案件取整数量和取整案件分布，所述案件取整数量用于表征所述时空标记点的案件数量，所述取整案件分布用于表征所述时空标记点的目标案件在空间和时间的分布情况；

对所述取整分布结果进行计算处理，得到目标分布结果；其中，所述目标分布结果包括目标案件数量和目标案件分布，所述目标案件数量用于表征所述待测区域中的案件数量，所述目标案件分布用于表征所述待测区域中的目标案件在空间和时间的分布情况。

在一些实施例中，所述对待测区域进行时空粒度划分，得到多个时空标记点，包括：

基于时间维度对所述待测区域进行时间粒度划分，得到多个时间粒度；

基于空间维度对所述待测区域进行空间粒度划分，得到多个空间粒度；

将一对所述时间粒度和所述空间粒度进行组合，得到所述时空标记点。

在一些实施例中，在所述将每一所述原始数据输入到分布预测模型中进行预测处理，得到对应的初步分布结果之前，所述方法还包括：构建所述分布预测模型，具体包括：

获取样本特征数据集；其中，所述样本特征数据集包括多个样本特征数据，每一所述样本特征数据包括原始样本特征和对应的原始案件数量；

将每一所述原始样本特征输入到预设的原始分布模型中进行训练处理，得到对应的训练案件数量；

根据所述原始案件数量和训练案件数量对所述原始分布模型的参数进行更新处理，得到所述分布预测模型。

在一些实施例中，所述根据所述原始案件数量和训练案件数量对所述原始分布模型的参数进行更新处理，得到所述分布预测模型，包括：

对预设时段的所述原始案件数量和所述训练案件数量进行求差计算，得到对应的偏差值；所述预设时段包括起始时间和结束时间；

获取在所述起始时间之前的多个所述原始案件数量中的最大值、最小值、均值和方差；

获取在所述结束时间之后的所述原始案件数量，得到目标标签；

根据所述偏差值、所述最大值、所述最小值、所述均值、所述方差和所述目标标签调整所述原始分布模型的参数，得到所述分布预测模型。

在一些实施例中，在所述将所述初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取整分布结果之前，所述方法还包括：构建所述分布取整模型，具体包括：

获取与所述时空标记点相匹配的取整样本数据集；

将所述取整样本数据集输入到原始取整模型进行训练处理，得到所述分布取整模型。

在一些实施例中，所述将所述取整样本数据集输入到原始取整模型进行训练处理，得到所述分布取整模型，包括：

对所述取整样本数据集进行分类处理，得到取整训练集和取整验证集；

对所述取整训练集中的每一所述取整训练数据进行网格搜索，并调整所述原始取整模型的参数；

根据所述取整验证集对调整参数后的所述原始取整模型进行交叉验证，得到多个验证分数；

取所述多个验证分数中分数值最高的验证分数对应的原始取整模型作为所述分布取整模型。

在一些实施例中，所述对多个所述取整分布结果进行计算处理，得到目标分布结果，包括：

对所有所述取整分布结果中的案件取整数量进行求和处理，得到所述目标案件数量；

对所有所述取整分布结果中的取整案件分布进行组合处理，得到所述目标案件分布；

根据所述目标案件分布和所述目标案件数量得到所述目标分布情况。

为实现上述目的，本申请实施例的第二方面提出了一种目标案件的预测装置，所述装置包括：

划分模块，用于对待测区域进行时空粒度划分，得到多个时空标记点；每一所述时空标记点包括一对时间粒度和空间粒度；

获取模块，用于获取每一所述时空标记点的原始数据；

预测模块，用于将每一所述原始数据输入到分布预测模型中进行预测处理，得到对应的初步分布结果；

取整模块，用于将所述初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取整分布结果；其中，所述取整分布结果包括案件取整数量和取整案件分布，所述案件取整数量用于表征所述时空标记点的案件数量，所述取整案件分布用于表征所述时空标记点的目标案件在空间和时间的分布情况；

计算模块，用于对所述取整分布结果进行计算处理，得到目标分布结果；其中，所述目标分布结果包括目标案件数量和目标案件分布，所述目标案件数量用于表征所述待测区域中的案件数量，所述目标案件分布用于表征所述待测区域中的目标案件在空间和时间的分布情况。

为实现上述目的，本申请实施例的第三方面还提出了一种电子设备，包括：

至少一个存储器；

至少一个处理器；

至少一个程序；

所述程序被存储在所述存储器中，处理器执行所述至少一个程序以实现：

如第一方面实施例任一项所述的方法。

为实现上述目的，本申请实施例的第四方面还提出了一种存储介质，所属存储介质为计算机存储介质，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行：

如第一方面实施例任一项所述的方法。

本申请实施例提出的目标案件的预测方法和装置、电子设备、存储介质，通过对待测区域进行时空粒度划分，得到多个时空标记点，然后单独获取每一时空标记点的原始数据，再将每一时空标记点的原始数据输入到分布预测模型中进行预测处理，得到初步分布结果。但是，分布预测模型得到的初步分布结果是带有小数的，然而，真实的案件量只能是整数，因此，需要将初步分布结果进行取整处理。在本申请实施例中，通过将每一时空标记点对应的初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取证分布结果，然后再将每一时空标记点对应的取整分布结果进行计算处理，得到表征待测区域整体案件分布情况的目标分布结果。通过这样设置，不仅能够实现目标案件数量的预测，还能够实现目标案件在时间和空间上的具体分布情况预测，提高了目标案件预测的准确性，从而有利于保险公司能够掌握待测区域的目标案件的具体分布情况，从而降低业务调度和救援成本。并且，本实施例的技术方案通过分布取整模型对目标案件的初步分布结果进行取整，得到取整分布结果，相比较于传统的使用四舍五入的取整方法，本申请实施例的技术方案得到的目标案件的分布结果更加准确。

附图说明

图1是本申请实施例提供的目标案件的预测方法的第一流程图；

图2是图1中步骤S100的具体方法的流程图；

图3是本申请实施例提供的目标案件的预测方法的第二流程图；

图4是图3中步骤S630的具体方法的流程图；

图5是本申请实施例提供的目标案件的预测方法的第三流程图；

图6是图5中步骤S720的具体方法的流程图；

图7是图1中步骤S500的具体方法的流程图；

图8是本申请实施例提供的目标案件的预测装置的模块框图；

图9是本申请实施例提供的电子设备的硬件结构示意图。

具体实施方式

为了使本申请的目的、技术方案及优点更加清楚明白，以下结合附图及实施例，对本申请进行进一步详细说明。应当理解，此处所描述的具体实施例仅用以解释本申请，并不用于限定本申请。

需要说明的是，虽然在装置示意图中进行了功能模块划分，在流程图中示出了逻辑顺序，但是在某些情况下，可以以不同于装置中的模块划分，或流程图中的顺序执行所示出或描述的步骤。说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。

除非另有定义，本文所使用的所有的技术和科学术语与属于本申请的技术领域的技术人员通常理解的含义相同。本文中所使用的术语只是为了描述本申请实施例的目的，不是旨在限制本申请。

首先，对本申请中涉及的若干名词进行解析：

人工智能(artificial intelligence，AI)：是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学；人工智能是计算机科学的一个分支，人工智能企图了解智能的实质，并生产出一种新的能以人类智能相似的方式做出反应的智能机器，该领域的研究包括机器人、语言识别、图像识别、自然语言处理和专家系统等。人工智能可以对人的意识、思维的信息过程的模拟。人工智能还是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

随机森林算法(Random Forest Regressor)：随机森林是一种集成算法(EnsembleLearning)，它属于Bagging类型，通过组合多个弱分类器，最终结果通过投票或取均值，使得整体模型的结果具有较高的精确度和泛化性能。其可以取得不错成绩，主要归功于“随机”和“森林”，一个使它具有抗过拟合能力，一个使它更加精准。随机森林的弱分类器使用的是CART数，CART决策树又称分类回归树。当数据集的因变量为连续性数值时，该树算法就是一个回归树，可以用叶节点观察的均值作为预测值；当数据集的因变量为离散型数值时，该树算法就是一个分类树，可以很好地解决分类问题。由于树的组合，是的随机森林可以处理非线性数据，本身属于非线性分类拟合模型。随机森林具有实现简单、精度高和抗过拟合能力强等特点。Bagging也叫自举汇聚法(bootstrap aggregating)，是一种在原始数据集上通过有放回抽样重新选出k个新数据集来训练分类器的集成技术。它使用训练出来的分类器的集合来对新样本进行分类，然后用多数投票或者对输出求均值的方法统计所有分类器的分类结果，结果最高的类别即为最终标签。

网格搜索算法：网格搜索法是指定参数值的一种穷举搜索方法，通过将估计函数的参数通过交叉验证的方法进行优化来得到最优的学习算法。即，将各个参数可能的取值进行排列组合，列出所有可能的组合结果生成“网格”。然后将各组合用于SVM训练，并使用交叉验证对表现进行评估。在拟合函数尝试了所有的参数组合后，返回一个合适的分类器，自动调整至最佳参数组合，可以通过clf.best_params_获得参数值。

相关技术中，对于目标案件的预测，多给予固定城市或者区域的历史案件量，采用时间序列或者回归预测等方式进行历史保险案件分布规律的捕捉，从而实现对目标案件数量的预测；或者直接对历史案件数量进行均值(如平均数、众数、中位数等等)计算，并将均值计算得到的案件量作为目标案件数量。然后，再将从空间和时间上取目标案件数量的平均值作为待测区域的时间和空间上的具体分布。上述方法存在以下不足：

第一：在实际生活中，目标案件并不符合均匀分布的规律，简单地将目标案件数量在时间上和空间上取均值作为待测区域在时间和空间上的具体分布是不准确的，容易导致目标案件预测的不准确。

第二：无法灵活预测新区域目标案件量。上述方法的核心点是需要获取历史案件量，然而，对于一个新区域来说，其不存在历史案件量，因此，上述方法无法实现对新区域的目标案件量的预测。

第三：无法表征案件量在时间和空间上的分布。例如：某个待测区域内，包括A区域和B区域，由于经济科技发展水平不同，或者其他特殊原因，A区域和B区域内的目标案件分布存在着区别。如果采取上述去平均值的算法，将得到的目标案件数量的平均值作为待测区域的时间和空间上的具体分布，是不准确的。并且，这种方式无法得知目标案件在空间上的稀疏和稠密，导致无法制定相关的执行方案。

第四：上述方式预测得到的目标案件量存在小数，然而，现实中的案件是离散型的整数数值，这与实际情况不符。而如果简单地将目标案件量进行四舍五入取整，导致进一步降低目标案件预测的准确率。

基于此，本申请提出一种目标案件的预测方法和装置、电子设备、存储介质，能够实现目标案件在空间和时间上的预测，并且，通过取整模型对初步分布结果进行取整处理，得到目标分布结果，从而提高了目标案件预测准确度。

本申请实施例提供的目标案件的预测方法和装置、电子设备、存储介质，具体通过如下实施例进行说明，首先描述本公开实施例中的模型的训练方法。

本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中，人工智能(Artificial Intelligence，AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能，感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。

人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。

本申请实施例提供的模型的目标案件的预测方法，涉及人工智能技术领域，尤其涉及数据挖掘技术领域。本申请实施例提供的目标案件的预测方法可应用于终端中，也可应用于服务器端中，还可以是运行于终端或服务器端中的软件。在一些实施例中，终端可以是智能手机、平板电脑、笔记本电脑、台式计算机或者智能手表等；服务器可以是独立的服务器，也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(Content Delivery Network，CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器；软件可以是实现目标案件的预测方法的应用等，但并不局限于以上形式。

本申请可用于众多通用或专用的计算机系统环境或配置中。例如：个人计算机、服务器计算机、手持设备或便携式设备、平板型设备、多处理器系统、基于微处理器的系统、置顶盒、可编程的消费电子设备、网络PC、小型计算机、大型计算机、包括以上任何系统或设备的分布式计算环境等等。本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的历程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

下面结合附图对本申请的实施例做进一步阐述。

请参照图1，第一方面，本申请的一些实施例提供了一种目标案件的预测方法，包括但不限于步骤S100、步骤S200、步骤S300、步骤S400和步骤S500，下面结合图1对这五个步骤进行详细介绍。

步骤S100：对待测区域进行时空粒度划分，得到多个时空标记点；每一时空标记点包括一对时间粒度和空间粒度；

在一些实施例的步骤S100中，对待测区域进行时空粒度划分，得到多个时空标记点，有利于实现对待测区域的目标案件在时间和空间上的分布预测。

例如，将待测区域的时间划分为“年月日时”的粒度或者“年月周日”的，将待测区域的空间划分为若干个1km*1km的粒度，然后将时间粒度和空间粒度进行组合，得到多个时空标记点。

步骤S200：获取每一时空标记点的原始数据；

在一些实施例的步骤S200中，通过获取每一时空标记点的原始数据，从而便于后续对每一时空标记点进行案件预测。原始数据包括但不限于以下任意一种或者多种：历史案件数量、时间规律特征数据、节假日特征数据、天气特征数据、疫情特征数据、地理特征数据等等。

例如，待测区域是新的区域，由于不存在历史案件数量，因此，首先对待测区域进行时空粒度划分，得到多个时空标记点。再获取每一个时空标记点的时间规律特征数据、节假日特征数据、天气特征数据、疫情特征数据、地理特征数据，得到每一时空标记点对应的原始数据。

步骤S300：将每一原始数据输入到分布预测模型中进行预测处理，得到对应的初步分布结果；

步骤S400：将初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取整分布结果；其中，取整分布结果包括案件取整数量和取整案件分布，案件取整数量用于表征时空标记点的案件数量，取整案件分布用于表征时空标记点的目标案件在空间和时间的分布情况；

具体地，在一些实施例的步骤S300至步骤S400中，将每一时空标记点的原始数据输入到分布预测模型中进行预测处理，得到每一时空标记点对应的初步分布结果。然而，此时的初步分布结果往往是连续型的数值，并且带有小数点，因此，需要对初步分布结果进行取整处理，得到离散型的整数数值，使其更加符合实际情况。具体通过步骤S400的方式，将初步分布结果输入到分布取整模型中进行取整处理，得到每一时空标记点的取整分布结果。

在本申请实施例的技术方案中，采取训练好的随机森林算法模型作为分布预测模型，采取训练好的网格搜索算法模型作为分布取整模型。

步骤S500：对取整分布结果进行计算处理，得到目标分布结果；其中，目标分布结果包括目标案件数量和目标案件分布，目标案件数量用于表征待测区域中的案件数量，目标案件分布用于表征待测区域中的目标案件在空间和时间的分布情况。

具体地，在一些实施例的步骤S500中，将每一时空标记点对应的取整分布结果进行统计和组合处理，得到目标分布结果。

例如：需要对A市的目标案件进行预测处理，根据本申请实施例的技术方案，首先需要对A市进行时空粒度划分，将A市在时间上和空间上划分为多个粒度，然后，得到多个时空标记点。再分别获取每一个时空标记点的历史案件数量(如果有就获取)、时间规律特征数据、节假日特征数据、天气特征数据、疫情特征数据、地理特征数据等数据，得到原始数据；再分别对每一时空标记点的原始数据输入到分布预测模型中进行预测处理，得到每一时空标记点对应的初步分布结果，然后对该初步分布结果进行取整处理，得到取整分布结果。将所有时空标记点的取整分布结果中的案件取整数量相加，即可得到用于表征A市整体案件数量的目标案件数量，将所有时空标记点的取整分布结果中的取整案件分布组合在一起，即可得到目标案件在A市的具体分布，稠密感和稀疏感层次分明。并且，本申请实施例的技术方案还能够看出A是目标案件的分布趋势的变化。例如，需要了解A市一年内的目标案件总数和变化趋势，则在对A市进行时空粒度划分时，可以将其在时间上划分为“年”、“月”、“周”、“日”四个不同的维度，然后，分别采取上述方式进行目标案件预测，即可得到A市的目标案件的年变化趋势以及一年内的每个月、每周、每天的变化趋势。

本申请实施例的目标案件的预测方法，通过对待测区域进行时空粒度划分，得到多个时空标记点，然后单独获取每一时空标记点的原始数据，再将每一时空标记点的原始数据输入到分布预测模型中进行预测处理，得到初步分布结果。但是，分布预测模型得到的初步分布结果是带有小数的，然而，真实的案件量只能是整数，因此，需要将初步分布结果进行取整处理。在本申请实施例中，通过将每一时空标记点对应的初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取证分布结果，然后再将每一时空标记点对应的取整分布结果进行计算处理，得到表征待测区域整体案件分布情况的目标分布结果。通过这样设置，不仅能够实现目标案件数量的预测，还能够实现目标案件在时间和空间上的具体分布情况预测，提高了目标案件预测的准确性，从而有利于保险公司能够掌握待测区域的目标案件的具体分布情况，从而降低业务调度和救援成本。并且，本实施例的技术方案通过分布取整模型对目标案件的初步分布结果进行取整，得到取整分布结果，相比较于传统的使用四舍五入的取整方法，本申请实施例的技术方案得到的目标案件的分布结果更加准确。

请参照图2，在本申请的一些实施例中，步骤S100包括步骤S110、步骤S120和步骤S130，应理解，步骤S100包括但不限于步骤S110至步骤S130，下面结合图2对这三个步骤进行详细介绍。

步骤S110：基于时间维度对待测区域进行时间粒度划分，得到多个时间粒度；

在一些实施例的步骤S110中，基于时间维度对待测区域进行时间粒度划分，即将待测区域按照“年、月、周、日”或者其他的特殊情况“如每三天”的规则进行划分，得到多个时间粒度。

步骤S120：基于空间维度对待测区域进行空间粒度划分，得到多个空间粒度；

在一些实施例的步骤S120中，基于空间维度对待测区域进行空间粒度划分，即将待测区域按照预设的空间划分规则进行空间粒度划分。如，将待测区域划分为1km*1km大小的空间粒度。

步骤S130：将一对时间粒度和空间粒度进行组合，得到时空标记点。

在一些实施例的步骤S130中，将前述步骤得到的时间粒度和空间粒度进行排列组合，即可得到时空标记点。

请参照图3，在本申请的一些实施例中，在步骤S300之前，目标案件的预测方法还包括：构建分布预测模型。

在一些实施例中，构建分布预测模型具体包括步骤S610、步骤S620和步骤S630，应理解，构建分布预测模型包括但不限于步骤S610至步骤S630，下面结合图3对这三个步骤进行详细描述。

步骤S610：获取样本特征数据集；其中，样本特征数据集包括多个样本特征数据，每一样本特征数据包括原始样本特征和对应的原始案件数量；

步骤S620：将每一原始样本特征输入到预设的原始分布模型中进行训练处理，得到对应的训练案件数量；

步骤S630：根据原始案件数量和训练案件数量对原始分布模型的参数进行更新处理，得到分布预测模型。

在本申请的实施例中，使用随机森林算法模型作为原始分布模型，采取双层建模机制解决稳定性和准确性问题。具体为：首先将原始样本特征输入到原始分布模型中进行初步训练，得到训练案件数量，然后再根据该时空标记点的实际案件量(原始案件数量)和训练案件数量对原始分布模型中的参数进行调整，得到分布预测模型。

需要说明的是，分布预测模型与前述步骤的时空标记点相对应，不同的时空标记点的分布预测模型存在着差别。

需要说明的是，原始样本特征与前述的原始数据相对应，原始样本特征包括但不限于以下任意一种或者多种：历史案件数量、时间规律特征数据、节假日特征数据、天气特征数据、疫情特征数据、地理特征数据等等。通过随机森林算法建模得到原始分布模型，实际上通过随机森林算法将上述原始样本特征进行建模得到原始分布模型。而调整原始分布模型的参数，即调整上述原始样本特征中每一个特征数据的系数。如，历史案件数量在原始分布模型中的系数、天气特征数据在原始分布模型中的系数等等。

请参照图4，在一些实施例中，步骤S630包括但不限于步骤S631、步骤S632、步骤S633和步骤S634，下面结合图4对这四个步骤进行详细介绍。

步骤S631：对预设时段的原始案件数量和训练案件数量进行求差计算，得到对应的偏差值；预设时段包括起始时间和结束时间；

步骤S632：获取起始时间之前的多个原始案件数量中的最大值、最小值、均值和方差；

步骤S633：获取结束时间之后的原始案件数量，得到目标标签；

步骤S634：根据偏差值、最大值、最小值、均值、方差和目标标签调整原始分布模型的参数，得到分布预测模型。

在本实施例中，将训练案件数量和原始案件数量进行比较，以获取偏差值，从而便于修正原始分布模型中的参数。具体为：首先对预设时段的原始案件数量和训练案件数量进行求差计算，得到对应的偏差值，然后获取起始时间之前的多个原始案件数量中的最大值、最小值、均值和方差，再将结束时间之后的下一个时段的原始案件数量作为目标标签，最后根据偏差值、最大值、最小值、均值、方差和目标标签调整原始分布模型的参数，得到分布预测模型。

需要说明的是，可以重复多次步骤S631至步骤S634的操作，以实现对原始分布模型的训练。

例如，在前叙步骤中，是根据“日”进行时间粒度划分的，则在本实施中，预设时段为“日”，那么调整的过程为：

对当天的原始案件数量和训练案件数量进行求差计算，得到对应的偏差值，然后，获取前几天多个原始案件数量(实际案件量)中的最大值、最小值、均值和方差，将偏差值、最大值、最小值、均值和方差为原始分布模型的输入，当前时段的第二天的原始案件数量(实际案件量)为目标标签，对原始分布模型的参数进行精调，从而得到与前叙步骤相匹配的分布预测模型。

请参照图5，在本申请的一些实施例中，在步骤S400之前，目标案件的预测方法还包括：构建分布取整模型。

在一些实施例中，构建分布取整模型具体包括步骤S710和步骤S720。下面结合图5对这两个步骤进行详细介绍。

步骤S710：获取与时空标记点相匹配的取整样本数据集；

步骤S720：将取整样本数据集输入到原始取整模型进行训练处理，得到分布取整模型。

具体地，在本实施例中，由于前述步骤得到的初步分布结果大部分是连续型的数值，且存在小数。因此需要构建分布取整模型对初步分布结果进行取整处理。具体为：获取与时空标记点相匹配的取整样本数据集，然后将取整样本数据集输入到原始取整模型进行训练处理，得到分布取整模型。在本实施例中，采取网格搜索算法作为原始取整模型。

请参照图6，在本申请的一些实施例中，步骤S720具体包括但不限于步骤S721、步骤S722、步骤S723和步骤S724，下面结合图6对这四个步骤进行详细解释。

步骤S721：对取整样本数据集进行分类处理，得到取整训练集和取整验证集；

步骤S722：对取整训练集中的每一取整训练数据进行网格搜索，并调整原始取整模型的参数；

步骤S723：根据取整验证集对调整参数后的原始取整模型进行交叉验证，得到多个验证分数；

步骤S724：取多个验证分数中分数值最高的验证分数对应的原始取整模型作为分布取整模型。

具体地，在本实施例中，网格搜索算法实际上是一种穷举算法，在训练过程中可能存在多种解法，因此，只需要使用验证集对调整参数后的原始取整模型进行交叉验证，得到多个验证分数，然后取多个验证分数中分数值最高的验证分数对应的原始取整模型作为分布取整模型即可。通过这样设置，能够根据前述步骤的时空标记点进行针对性的最优阈值参数迅捷，从而实现自适应且针对性的确定初步分布结果的取整阈值。

需要说明的是，与前述步骤的分布预测模型类似，本申请实施例的分布取整模型也与时空标记点相对应，不同的时空标记点的分布取整模型存在着差别，取整阈值不同。这样设置，能够实现自适应且针对性的取整，从而提高目标案件预测的准确性。

请参照图7，在本申请的一些实施例中，步骤S500包括但不限于步骤S510、步骤S520和步骤S530。

步骤S510：对所有取整分布结果中的案件取整数量进行求和处理，得到目标案件数量；

步骤S520：对所有取整分布结果中的取整案件分布进行组合处理，得到目标案件分布；

步骤S530：根据目标案件分布和目标案件数量得到目标分布情况。

在本实施例中，由于为了使目标预测结果更加准确，前述步骤对待测区域进行了时空粒度划分，得到多个时空标记点，然后，针对每一个时空标记点进行了目标案件的预测，因此，需要将分散的目标案件预测结果进行整合处理。具体为：对所有取整分布结果中的案件取整数量进行求和处理，得到目标案件数量，对所有取整分布结果中的取整案件分布进行组合处理，得到目标案件分布，根据目标案件分布和目标案件数量得到目标分布情况。

请参照图8，本申请的一些实施例还提出了一种目标案件的预测装置，该预测装置包括划分模块800、获取模块900、预测模块1000、取整模块1100和计算模块1200。

划分模块800，用于对待测区域进行时空粒度划分，得到多个时空标记点；每一时空标记点包括一对时间粒度和空间粒度；

获取模块900，用于获取每一时空标记点的原始数据；

预测模块1000，用于将每一原始数据输入到分布预测模型中进行预测处理，得到对应的初步分布结果；

取整模块1100，用于将初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取整分布结果；其中，取整分布结果包括案件取整数量和取整案件分布，案件取整数量用于表征时空标记点的案件数量，取整案件分布用于表征时空标记点的目标案件在空间和时间的分布情况；

计算模块1200，用于对取整分布结果进行计算处理，得到目标分布结果；其中，目标分布结果包括目标案件数量和目标案件分布，目标案件数量用于表征待测区域中的案件数量，目标案件分布用于表征待测区域中的目标案件在空间和时间的分布情况。

本申请实施例的目标案件的预测装置，通过对待测区域进行时空粒度划分，得到多个时空标记点，然后单独获取每一时空标记点的原始数据，再将每一时空标记点的原始数据输入到分布预测模型中进行预测处理，得到初步分布结果。但是，分布预测模型得到的初步分布结果是带有小数的，然而，真实的案件量只能是整数，因此，需要将初步分布结果进行取整处理。在本申请实施例中，通过将每一时空标记点对应的初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取证分布结果，然后再将每一时空标记点对应的取整分布结果进行计算处理，得到表征待测区域整体案件分布情况的目标分布结果。通过这样设置，不仅能够实现目标案件数量的预测，还能够实现目标案件在时间和空间上的具体分布情况预测，提高了目标案件预测的准确性，从而有利于保险公司能够掌握待测区域的目标案件的具体分布情况，从而降低业务调度和救援成本。并且，本实施例的技术方案通过分布取整模型对目标案件的初步分布结果进行取整，得到取整分布结果，相比较于传统的使用四舍五入的取整方法，本申请实施例的技术方案得到的目标案件的分布结果更加准确。

需要说明的是，本申请实施例的目标案件的预测装置与前述的目标案件的预测方法相对应，具体的处理过程或者预测过程请参照前述的目标案件的预测方法，在此不一一赘述。

本公开实施例还提供了一种电子设备，包括：

至少一个存储器；

至少一个处理器；

至少一个程序；

程序被存储在存储器中，处理器执行至少一个程序以实现本公开实施上述的目标案件的预测方法。该电子设备可以为包括手机、平板电脑、个人数字助理(PersonalDigital Assistant，PDA)、车载电脑等任意智能终端。

本申请实施例的电子设备，通过执行上述的目标案件的预测方法，通过对待测区域进行时空粒度划分，得到多个时空标记点，然后单独获取每一时空标记点的原始数据，再将每一时空标记点的原始数据输入到分布预测模型中进行预测处理，得到初步分布结果。但是，分布预测模型得到的初步分布结果是带有小数的，然而，真实的案件量只能是整数，因此，需要将初步分布结果进行取整处理。在本申请实施例中，通过将每一时空标记点对应的初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取证分布结果，然后再将每一时空标记点对应的取整分布结果进行计算处理，得到表征待测区域整体案件分布情况的目标分布结果。通过这样设置，不仅能够实现目标案件数量的预测，还能够实现目标案件在时间和空间上的具体分布情况预测，提高了目标案件预测的准确性，从而有利于保险公司能够掌握待测区域的目标案件的具体分布情况，从而降低业务调度和救援成本。并且，本实施例的技术方案通过分布取整模型对目标案件的初步分布结果进行取整，得到取整分布结果，相比较于传统的使用四舍五入的取整方法，本申请实施例的技术方案得到的目标案件的分布结果更加准确。

下面结合图9对本申请实施例的电子设备进行详细介绍。

如图9，图9示意了另一实施例的电子设备的硬件结构，电子设备包括：

处理器1300，可以采用通用的中央处理器(Central Processing Unit，CPU)、微处理器、应用专用集成电路(Application Specific Integrated Circuit，ASIC)、或者一个或多个集成电路等方式实现，用于执行相关程序，以实现本公开实施例所提供的技术方案；

存储器1400，可以采用只读存储器(Read Only Memory，ROM)、静态存储设备、动态存储设备或者随机存取存储器(Random Access Memory，RAM)等形式实现。存储器1400可以存储操作系统和其他应用程序，在通过软件或者固件来实现本说明书实施例所提供的技术方案时，相关的程序代码保存在存储器1400中，并由处理器1300来调用执行本公开实施例的目标案件的预测方法；

输入/输出接口1500，用于实现信息输入及输出；

通信接口1600，用于实现本设备与其他设备的通信交互，可以通过有线方式(例如USB、网线等)实现通信，也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信；

总线1700，在设备的各个组件(例如处理器1300、存储器1400、输入/输出接口1500和通信接口1600)之间传输信息；

其中处理器1300、存储器1400、输入/输出接口1500和通信接口1600通过总线1700实现彼此之间在设备内部的通信连接。

本公开实施例还提供了一种存储介质，该存储介质是计算机可读存储介质，该计算机可读存储介质存储有计算机可执行指令，该计算机可执行指令用于使计算机执行上述目标案件的预测方法。

本申请实施例的存储介质，通过执行上述的目标案件的预测方法，通过对待测区域进行时空粒度划分，得到多个时空标记点，然后单独获取每一时空标记点的原始数据，再将每一时空标记点的原始数据输入到分布预测模型中进行预测处理，得到初步分布结果。但是，分布预测模型得到的初步分布结果是带有小数的，然而，真实的案件量只能是整数，因此，需要将初步分布结果进行取整处理。在本申请实施例中，通过将每一时空标记点对应的初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取证分布结果，然后再将每一时空标记点对应的取整分布结果进行计算处理，得到表征待测区域整体案件分布情况的目标分布结果。通过这样设置，不仅能够实现目标案件数量的预测，还能够实现目标案件在时间和空间上的具体分布情况预测，提高了目标案件预测的准确性，从而有利于保险公司能够掌握待测区域的目标案件的具体分布情况，从而降低业务调度和救援成本。并且，本实施例的技术方案通过分布取整模型对目标案件的初步分布结果进行取整，得到取整分布结果，相比较于传统的使用四舍五入的取整方法，本申请实施例的技术方案得到的目标案件的分布结果更加准确。

存储器作为一种非暂态计算机可读存储介质，可用于存储非暂态软件程序以及非暂态性计算机可执行程序。此外，存储器可以包括高速随机存取存储器，还可以包括非暂态存储器，例如至少一个磁盘存储器件、闪存器件或其他非暂态固态存储器件。在一些实施方式中，存储器可选包括相对于处理器远程设置的存储器，这些远程存储器可以通过网络连接至该处理器。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。

本公开实施例描述的实施例是为了更加清楚的说明本公开实施例的技术方案，并不构成对于本公开实施例提供的技术方案的限定，本领域技术人员可知，随着技术的演变和新应用场景的出现，本公开实施例提供的技术方案对于类似的技术问题，同样适用。

本领域技术人员可以理解的是，图中示出的技术方案并不构成对本公开实施例的限定，可以包括比图示更多或更少的步骤，或者组合某些步骤，或者不同的步骤。

以上所描述的装置实施例仅仅是示意性的，其中作为分离部件说明的单元可以是或者也可以不是物理上分开的，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。

本领域普通技术人员可以理解，上文中所公开方法中的全部或某些步骤、系统、设备中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。

本申请的说明书及上述附图中的术语“第一”、“第二”、“第三”、“第四”等(如果存在)是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

应当理解，在本申请中，“至少一个(项)”是指一个或者多个，“多个”是指两个或两个以上。“和/或”，用于描述关联对象的关联关系，表示可以存在三种关系，例如，“A和/或B”可以表示：只存在A，只存在B以及同时存在A和B三种情况，其中A，B可以是单数或者复数。字符“/”一般表示前后关联对象是一种“或”的关系。“以下至少一项(个)”或其类似表达，是指这些项中的任意组合，包括单项(个)或复数项(个)的任意组合。例如，a，b或c中的至少一项(个)，可以表示：a，b，c，“a和b”，“a和c”，“b和c”，或“a和b和c”，其中a，b，c可以是单个，也可以是多个。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置和方法，可以通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如，单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性，机械或其它的形式。

作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括多指令用以使得一台电子设备(可以是个人计算机，服务器，或者网络设备等)执行本申请各个实施例方法的全部或部分步骤。而前述的存储介质包括：U盘、移动硬盘、只读存储器(Read-Only Memory，ROM)、随机存取存储器(Random Access Memory，RAM)、磁碟或者光盘等各种可以存储程序的介质。

以上参照附图说明了本公开实施例的优选实施例，并非因此局限本公开实施例的权利范围。本领域技术人员不脱离本公开实施例的范围和实质内所作的任何修改、等同替换和改进，均应在本公开实施例的权利范围之内。

Claims

1.一种目标案件的预测方法，其特征在于，所述方法包括：

获取每一所述时空标记点的原始数据；

对所述取整分布结果进行计算处理，得到目标分布结果；其中，所述目标分布结果包括目标案件数量和目标案件分布，所述目标案件数量用于表征所述待测区域中的案件数量，所述目标案件分布用于表征所述待测区域中的目标案件在空间和时间的分布情况；

其中，在所述将每一所述原始数据输入到分布预测模型中进行预测处理，得到对应的初步分布结果之前，所述方法还包括：构建所述分布预测模型，具体包括：

根据所述原始案件数量和训练案件数量对所述原始分布模型的参数进行更新处理，得到所述分布预测模型；

其中，在所述将所述初步分布结果输入到预设的分布取整模型中进行取整处理，得到对应的取整分布结果之前，所述方法还包括：构建所述分布取整模型，具体包括：

获取与所述时空标记点相匹配的取整样本数据集；

对所述取整训练集中的每一所述取整训练数据进行网格搜索，并调整原始取整模型的参数；

2.根据权利要求1所述的方法，其特征在于，所述对待测区域进行时空粒度划分，得到多个时空标记点，包括：

3.根据权利要求1或2所述的方法，其特征在于，所述根据所述原始案件数量和训练案件数量对所述原始分布模型的参数进行更新处理，得到所述分布预测模型，包括：

获取在所述起始时间前的多个所述原始案件数量中的最大值、最小值、均值和方差；

获取在所述结束时间后的所述原始案件数量，得到目标标签；

4.根据权利要求1或2所述的方法，其特征在于，所述对多个所述取整分布结果进行计算处理，得到目标分布结果，包括：

5.一种目标案件的预测装置，其特征在于，所述装置包括：

获取模块，用于获取每一所述时空标记点的原始数据；

计算模块，用于对所述取整分布结果进行计算处理，得到目标分布结果；其中，所述目标分布结果包括目标案件数量和目标案件分布，所述目标案件数量用于表征所述待测区域中的案件数量，所述目标案件分布用于表征所述待测区域中的目标案件在空间和时间的分布情况；

其中，所述预测装置还用于：构建所述分布预测模型，具体包括：

其中，所述预测装置还用于：构建所述分布取整模型，具体包括：

获取与所述时空标记点相匹配的取整样本数据集；

6.一种电子设备，其特征在于，包括：

至少一个存储器；

至少一个处理器；

至少一个程序；

如权利要求1至4任一项所述的方法。

7.一种存储介质，所述存储介质为计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机可执行指令，所述计算机可执行指令用于使计算机执行：

如权利要求1至4任一项所述的方法。