CN115828011A

CN115828011A - 基于大数据的数据分析方法和平台

Info

Publication number: CN115828011A
Application number: CN202211254667.5A
Authority: CN
Inventors: 丁浩冉; 王梦琦
Original assignee: Xuzhou Hai Qing Mdt Infotech Ltd
Current assignee: Sichuan Hongzhi Kexin Digital Technology Co ltd
Priority date: 2022-10-13
Filing date: 2022-10-13
Publication date: 2023-03-21
Anticipated expiration: 2042-10-13
Also published as: CN115828011B

Abstract

本申请提供的基于大数据的数据分析方法和平台，涉及大数据技术领域。在本申请中，基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，构建出对应的目标区域代表行为分布网络序列；依据包括的区域代表行为信息，从多个参考区域代表行为分布网络序列中，筛选出与目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列；对目标区域和匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在目标区域和其它区域之间形成关联关系。基于上述步骤，可以在一定程度上提高关联关系确定的可靠度。

Description

基于大数据的数据分析方法和平台

技术领域

本申请涉及大数据技术领域，具体而言，涉及一种基于大数据的数据分析方法和平台。

背景技术

确定出不同对象之间是否具有关联关系，或者，在多个其它对象中确定出与目标对象之间具有关联关系的相关其它对象，在诸多领域和场景中都有应用。例如，针对一个区域，可能需要在多个其它区域中确定出与这一个区域具有关联关系的相关其它区域。但是，在现有技术中，一般是基于区域之间的地理位置来确定是否具有相关关系，使得其可靠度并不高。

发明内容

有鉴于此，本申请的目的在于提供一种基于大数据的数据分析方法和平台，以在一定程度上提高关联关系确定的可靠度。

为实现上述目的，本申请实施例采用如下技术方案：

一种基于大数据的数据分析，包括：

基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，构建出所述目标区域对应的目标区域代表行为分布网络序列，所述目标区域代表行为分布网络序列包括多个目标区域代表行为分布网络，所述多个目标区域代表行为分布网络和所述多个历史时间一一对应，每一个所述目标区域代表行为分布网络包括多条目标区域代表行为信息，该多条目标区域代表行为信息和所述多个目标子区域一一对应；

依据包括的区域代表行为信息，从目标行为数据库包括的多个参考区域代表行为分布网络序列中，筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列；

对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在所述目标区域和所述其它区域之间形成关联关系。

在一种可能的实施例中，在上述基于大数据的金融业务处理方法中，所述基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，构建出所述目标区域对应的目标区域代表行为分布网络序列的步骤，包括：

提取到目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，一条所述目标区域代表行为信息基于从一个目标子区域在一个历史时间下具有的至少一条区域行为信息筛选出；

依据对应的历史时间是否相同，对所述目标区域代表行为信息进行分类处理，以形成所述多个历史时间对应的多个目标区域代表行为信息集合，以及，对于每一个所述目标区域代表行为信息集合，将该目标区域代表行为信息集合包括的每一条目标区域代表行为信息按照对应的目标子区域进行分布，以构建出对应的目标区域代表行为分布网络；

按照对应的历史时间，对所述目标区域代表行为分布网络进行排序，以形成所述目标区域对应的目标区域代表行为分布网络序列。

在一种可能的实施例中，在上述基于大数据的金融业务处理方法中，所述依据包括的区域代表行为信息，从目标行为数据库包括的多个参考区域代表行为分布网络序列中，筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤，包括：

在目标区域代表行为分布网络序列中，抽选出多个目标区域代表行为分布网络，该多个目标区域代表行为分布网络为所述目标区域代表行为分布网络序列包括的各目标区域代表行为分布网络中的至少部分；

针对每一个所述目标区域代表行为分布网络，利用预先进行网络优化形成的目标行为关键信息挖掘神经网络，挖掘出所述目标区域代表行为分布网络对应的第一行为关键信息描述向量；

在多个代表行为关键信息描述向量中，抽选出所述目标区域代表行为分布网络对应的相关代表行为关键信息描述向量，所述相关代表行为关键信息描述向量为与所述目标区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量，每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量；

基于所述目标区域代表行为分布网络对应的第一行为关键信息描述向量与对应的所述相关代表行为关键信息描述向量之间的区别信息，分析输出所述目标区域代表行为分布网络对应的第二行为关键信息描述向量；

利用所述目标行为关键信息挖掘神经网络，基于所述目标区域代表行为分布网络对应的第二行为关键信息描述向量，分析输出所述目标区域代表行为分布网络对应的第三行为关键信息描述向量，所述目标区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述目标区域代表行为分布网络包括的目标区域代表行为信息具有的行为关键信息；

基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量，分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量；

基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量，在所述目标行为数据库中，筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列，并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。

在一种可能的实施例中，在上述基于大数据的金融业务处理方法中，所述基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量，分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量的步骤，包括：

对所述目标区域代表行为分布网络进行类型确定处理，以形成对应的多种行为分布网络类型信息，每一种所述行为分布网络类型信息对应有至少一个目标区域代表行为分布网络；

分别对每一种所述行为分布网络类型信息对应的目标区域代表行为分布网络对应的第三行为关键信息描述向量进行分类处理，以形成每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量；

基于每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量，分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量。

在一种可能的实施例中，在上述基于大数据的金融业务处理方法中，所述基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量，在所述目标行为数据库中，筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列，并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤，包括：

基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量，在所述目标行为数据库中，抽取出多个参考区域代表行为分布网络序列，以标记为所述目标区域代表行为分布网络序列对应的待确认区域代表行为分布网络序列；

依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量，分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数；

基于每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数之间具有的相对大小信息，在所述待确认区域代表行为分布网络序列中，抽选出一个待确认区域代表行为分布网络序列作为第一参考区域代表行为分布网络序列，并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。

在一种可能的实施例中，在上述基于大数据的金融业务处理方法中，所述依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量，分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数的步骤，包括：

对于每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量，对该待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量和所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量进行匹配度计算，以输出对应的描述向量匹配度；

分别统计每一个所述待确认区域代表行为分布网络序列包括的参考区域代表行为分布网络的数量，再分别基于该数量确定出每一个所述待确认区域代表行为分布网络序列对应的序列重要度；

分别基于每一个所述待确认区域代表行为分布网络序列对应的序列重要度和对应的描述向量匹配度，分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数。

在一种可能的实施例中，在上述基于大数据的金融业务处理方法中，所述目标行为关键信息挖掘神经网络的网络优化的步骤，包括：

利用初始的目标行为关键信息挖掘神经网络，挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量；

基于所述示例性区域代表行为分布网络簇包括的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量，分析输出对应的多个代表行为关键信息描述向量，每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量，所述示例性区域代表行为分布网络簇对应有多个行为分布网络分类簇；

针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络，基于所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量之间的区别信息，分析输出所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量，所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量为所述多个代表行为关键信息描述向量中与所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量；

基于所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量，分析输出所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量，所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述示例性区域代表行为分布网络包括的示例性区域代表行为信息具有的行为关键信息；

基于所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量，分析输出所述目标行为关键信息挖掘神经网络对应的神经网络目标学习代价值，再基于所述神经网络目标学习代价值对所述初始的目标行为关键信息挖掘神经网络进行网络优化处理。

在一种可能的实施例中，在上述基于大数据的金融业务处理方法中，所述利用初始的目标行为关键信息挖掘神经网络，挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量的步骤，包括：

针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络，利用初始的目标行为关键信息挖掘神经网络包括的浅层关键信息挖掘子网络对所述示例性区域代表行为分布网络进行第一关键信息挖掘处理，以输出所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量；

利用所述目标行为关键信息挖掘神经网络包括的深层关键信息挖掘子网络对所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量进行第二关键信息挖掘处理，以输出所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量。

在一种可能的实施例中，在上述基于大数据的金融业务处理方法中，所述对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在所述目标区域和所述其它区域之间形成关联关系的步骤，包括：

获取所述目标区域代表行为分布网络序列和所述匹配区域代表行为分布网络序列之间的序列匹配程度；

基于所述序列匹配程度对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在所述目标区域和所述其它区域之间形成关联关系，所述关联关系表征的关联度等于所述序列匹配程度。

本申请还提供一种基于大数据的数据分析平台，包括处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于执行所述计算机程序，以实现上述的基于大数据的数据分析方法。

本申请提供的一种基于大数据的数据分析方法和平台，基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，构建出对应的目标区域代表行为分布网络序列；依据包括的区域代表行为信息，从多个参考区域代表行为分布网络序列中，筛选出与目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列；对目标区域和匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在目标区域和其它区域之间形成关联关系。基于上述步骤，由于是基于区域对应的代表行为信息进行关联分析，而代表行为信息的信息丰富度更高，使得相较于简单地基于地理位置来进行关联分析的常规技术方案，分析依据更为充分，从而可以在一定程度上提高关联关系确定的可靠度。

为使本申请的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。

附图说明

图1为本申请实施例提供的基于大数据的数据分析平台的结构框图。

图2为本申请实施例提供的基于大数据的数据分析方法包括的各步骤的流程示意图。

图3为本申请实施例提供的基于大数据的关联性分析方法包括的各步骤的流程示意图。

具体实施方式

为使本申请实施例的目的、技术方案和优点更加清楚，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例只是本申请的一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

图1示出了一种基于大数据的数据分析平台（如一种具备数据处理能力的服务器），其中，所述基于大数据的数据分析平台包括总线或者用于通信信息的其它通信组件、和耦合至总线的用于处理信息的处理器。其中，所述基于大数据的数据分析平台还可以包括耦合至总线的用于存储信息的主存储器(诸如，随机存取存储器(RAM)或者其它动态存储设备)和待由处理器执行的指令。主存储器还可以用于存储位置信息、临时变量、或者在处理器执行指令期间的其它中间信息。其中，所述基于大数据的数据分析平台还可以进一步包括只读存储器(ROM)或者耦合至总线的用于存储用于处理器的静态信息和指令的其它静态存储设备。存储设备(诸如，固态设备、磁盘或者光盘)被耦合至总线以便持久地存储信息和指令。

另外，在一些实施方式中，可以经由总线来将所述基于大数据的数据分析平台耦合至显示器(诸如，液晶显示器、或者有源矩阵显示器)以便向用户显示信息。另外，在一些实施方式中，可以将输入设备(诸如，包括字母数字键和其它键的键盘)耦合至总线以便向处理器通信信息和命令选择。另外，在一些实施方式中，输入设备可以具有触摸屏显示器。另外，在一些实施方式中，输入设备可以包括用于向处理器通信方向信息和命令选择以及用于控制在显示器上的光标移动的光标控件(诸如，鼠标、轨迹球、或者光标方向键)。

另外，在一些实施方式中，所述基于大数据的数据分析平台可以包括通信适配器(网络适配器)。另外，在各种说明性实施方式中，可以使用通信适配器来实现任何类型的组网配置，诸如，有线、无线、预配置、对等点对点、LAN、WAN等。

可以理解的是，虽然已经在图1中对示例处理系统进行了描述，但是可以通过使用其它类型的数字电子电路系统、或者在计算机软件、固件、或者硬件中(包括本说明书所公开的结构及其结构等效物)、或者它们中的一个或者多个的组合中实现本说明书中描述的主题的实施方式和功能操作，如后文所述的基于大数据的数据分析方法。

结合图2，本申请实施例还提供一种基于大数据的数据分析方法，可应用于上述基于大数据的数据分析平台。其中，所述基于大数据的数据分析方法有关的流程所定义的方法步骤，可以由所述基于大数据的数据分析平台实现。下面将对图2所示的具体流程，进行详细阐述。

步骤S110，基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，构建出所述目标区域对应的目标区域代表行为分布网络序列。

在本发明实施例中，所述基于大数据的数据分析平台可以基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，构建出所述目标区域对应的目标区域代表行为分布网络序列。所述目标区域代表行为分布网络序列包括多个目标区域代表行为分布网络，所述多个目标区域代表行为分布网络和所述多个历史时间一一对应，每一个所述目标区域代表行为分布网络包括多条目标区域代表行为信息，该多条目标区域代表行为信息和所述多个目标子区域一一对应。

步骤S120，依据包括的区域代表行为信息，从目标行为数据库包括的多个参考区域代表行为分布网络序列中，筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。

在本发明实施例中，所述基于大数据的数据分析平台可以依据包括的区域代表行为信息，从目标行为数据库包括的多个参考区域代表行为分布网络序列中，筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。

步骤S130，对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在所述目标区域和所述其它区域之间形成关联关系。

在本发明实施例中，所述基于大数据的数据分析平台可以对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在所述目标区域和所述其它区域之间形成关联关系，实现区域关联。

基于此，由于是基于区域对应的代表行为信息进行关联分析，而代表行为信息的信息丰富度更高，使得相较于简单地基于地理位置来进行关联分析的常规技术方案，分析依据更为充分，从而可以在一定程度上提高关联关系确定的可靠度，进而改善现有技术中存在的可靠度不高的问题。

另外，在一些实施方式中，对于上述的步骤S110，可以包括：

提取到目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，一条所述目标区域代表行为信息基于从一个目标子区域在一个历史时间下具有的至少一条区域行为信息筛选出（一条区域行为信息可以是指互联网行为，也可以是指物理世界的行为等）；

依据对应的历史时间是否相同，对所述目标区域代表行为信息进行分类处理，以形成所述多个历史时间对应的多个目标区域代表行为信息集合，以及，对于每一个所述目标区域代表行为信息集合，将该目标区域代表行为信息集合包括的每一条目标区域代表行为信息按照对应的目标子区域（的位置坐标）进行分布，以构建出对应的目标区域代表行为分布网络；

按照对应的历史时间，对所述目标区域代表行为分布网络进行排序，以形成所述目标区域对应的目标区域代表行为分布网络序列（如此，使得所述目标区域代表行为分布网络序列中的目标区域代表行为信息不仅具有对应的行为信息，还携带有不同行为之间的时间关系和位置关系，使得所述目标区域代表行为分布网络序列的内容更为丰富）。

另外，在一些实施方式中，对于上述的所述一条所述目标区域代表行为信息基于从一个目标子区域在一个历史时间下具有的至少一条区域行为信息筛选出，其具体的实现过程，可以包括：

提取出一个目标子区域在一个历史时间下具有的多条区域互联网行为信息，每一条所述区域互联网行为信息用于反映对应的一个互联网用户再所述历史时间下进行的一个互联网行为（如浏览文章、观看视频、游戏等）；

基于对应的行为类型，对所述多条区域互联网行为信息进行分类处理，以形成对应的至少一种类型分类集合，每一个所述类型分类集合包括至少一条区域互联网行为信息，同一个所述类型分类集合中的每两条区域互联网行为信息对应的行为类型相同（如都是浏览文章），不同所述类型分类集合中的每两条区域互联网行为信息对应的行为类型不同（如一个对应的行为类型为浏览文字，另一个对应的行为类型为观看视频）；

提取出预先配置的多条互联网行为序列，每一条所述互联网行为序列基于对应的一个互联网用户在多个历史时间下的多个历史互联网行为构成，且该多个历史互联网行为按照对应的历史时间的先后进行排序；

对于每一条所述互联网行为序列，提取出该互联网行为序列包括的每一个历史互联网行为的行为类型，以构建形成该互联网行为序列对应的行为类型序列，所述多条互联网行为序列对应有多条行为类型序列；

对于每一种所述类型分类集合，在所述多条行为类型序列中，确定出包括该类型分类集合对应的行为类型的每一条行为类型序列，并标记为该类型分类集合对应的相关行为类型序列，并统计该类型分类集合对应的相关行为类型序列的数量，以得到该类型分类集合对应的相关序列统计数量，以及，确定该类型分类集合对应的行为类型分别在对应的每一条相关行为类型序列中的序列位置和序列中间位置之间的位置距离，并对该位置距离进行均值计算，以得到该类型分类集合对应的代表位置距离；

对于每一种所述类型分类集合，依据该类型分类集合对应的相关序列统计数量，确定出该类型分类集合对应的第一重要系数，再依据该类型分类集合对应的代表位置距离，确定出该类型分类集合对应的第二重要系数，所述第一重要系数与所述相关序列统计数量之间具有正相关的关系，所述第二重要系数与所述代表位置距离之间具有负相关的关系，以及，对该第一重要系数和该第二重要系数进行加权求和，以得到该类型分类集合对应的目标重要系数，在进行加权求和的过程中，所述第一重要系数对应的权重值可以大于所述第二重要系数对应的权重值；

将对应的目标重要系数最大的目标数量个类型分类集合（所述目标数量的具体数值不受限制，如2、3、4、5等数值），标记为目标类型分类集合，以得到目标数量个目标类型分类集合；以及，针对每一个所述目标类型分类集合，从该目标类型分类集合中提取出对应的行为持续时间最长的一条区域互联网行为信息，作为该目标类型分类集合对应的目标区域互联网行为信息，以及，基于对应的目标重要系数的大小关系，对每一个所述目标类型分类集合对应的目标区域互联网行为信息进行顺序拼接，以形成对应的一条目标区域代表行为信息（如“做A、做B、做C”等）。

另外，在一些实施方式中，对于上述的步骤S120，可以包括：

在目标区域代表行为分布网络序列中，抽选出多个目标区域代表行为分布网络，该多个目标区域代表行为分布网络为所述目标区域代表行为分布网络序列包括的各目标区域代表行为分布网络中的至少部分（即可以时其中的一部分目标区域代表行为分布网络，也可以是其中的全部目标区域代表行为分布网络，根据实际需求进行配置即可）；

针对每一个所述目标区域代表行为分布网络，利用预先进行网络优化形成的目标行为关键信息挖掘神经网络，挖掘出所述目标区域代表行为分布网络对应的第一行为关键信息描述向量（示例性地，可以利用所述目标行为关键信息挖掘神经网络包括的浅层关键信息挖掘子网络对目标区域代表行为分布网络进行处理，得到目标区域代表行为分布网络对应的浅层行为关键信息描述向量；然后，再利用所述目标行为关键信息挖掘神经网络包括的深层关键信息挖掘子网络对目标区域代表行为分布网络对应的浅层行为关键信息描述向量进行处理，从而输出所述目标区域代表行为分布网络对应的第一行为关键信息描述向量）；

在多个代表行为关键信息描述向量中，抽选出所述目标区域代表行为分布网络对应的相关代表行为关键信息描述向量，所述相关代表行为关键信息描述向量为与所述目标区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量，每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量（所述行为分布网络分类簇可以是对多个示例性区域代表行为分布网络进行分类形成）；

基于所述目标区域代表行为分布网络对应的第一行为关键信息描述向量与对应的所述相关代表行为关键信息描述向量之间的区别信息，分析输出所述目标区域代表行为分布网络对应的第二行为关键信息描述向量（示例性地，可以对所述目标区域代表行为分布网络对应的第一行为关键信息描述向量和对应的所述相关代表行为关键信息描述向量进行向量求差处理，以得到对应的第二行为关键信息描述向量）；

基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量，分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量（示例性地，可以对一些无效的描述向量进行筛除等）；

另外，在一些实施方式中，对于上述的基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量，分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量的步骤，进一步可以包括以下的具体内容：

对所述目标区域代表行为分布网络进行类型确定处理，以形成对应的多种行为分布网络类型信息，每一种所述行为分布网络类型信息对应有至少一个目标区域代表行为分布网络（示例性地，可以基于对应的第三行为关键信息描述向量对所述目标区域代表行为分布网络进行分类，其中，同一个分类的目标区域代表行为分布网络，对应同一种行为分布网络类型信息，分类的原则可以是同一个分类的目标区域代表行为分布网络对应的第三行为关键信息描述向量之间的描述向量匹配度都大于预设匹配度）；

分别对每一种所述行为分布网络类型信息对应的目标区域代表行为分布网络对应的第三行为关键信息描述向量进行分类处理，以形成每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量（示例性地，针对一种所述行为分布网络类型信息，可以依据对应的第三行为关键信息描述向量之间的描述向量匹配度，对该行为分布网络类型信息对应的至少一个目标区域代表行为分布网络进行分类中心的确定处理，如将与其它第三行为关键信息描述向量之间的描述向量匹配度的均值最大的第三行为关键信息描述向量作为分类中心第三行为关键信息描述向量）；

基于每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量，分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量（示例性地，可以对每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量进行叠加或拼接，以形成所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量）。

另外，在一些实施方式中，对于上述的基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量，在所述目标行为数据库中，筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列，并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤，可以包括：

基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量，在所述目标行为数据库中，抽取出多个参考区域代表行为分布网络序列，以标记为所述目标区域代表行为分布网络序列对应的待确认区域代表行为分布网络序列（示例性地，所述待确认区域代表行为分布网络序列可以是与所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量之间的描述向量匹配度最大的一定数量的多个参考区域代表行为分布网络序列）；

基于每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数之间具有的相对大小信息，在所述待确认区域代表行为分布网络序列中，抽选出一个待确认区域代表行为分布网络序列作为第一参考区域代表行为分布网络序列（如对应的筛选优先系数最大），并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。

另外，在一些实施方式中，对于上述的依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量，分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数的步骤，进一步可以包括以下具体内容：

分别统计每一个所述待确认区域代表行为分布网络序列包括的参考区域代表行为分布网络的数量，再分别基于该数量确定出每一个所述待确认区域代表行为分布网络序列对应的序列重要度（示例性地，所述序列重要度和该数量之间可以具有正相关的对应关系）；

分别基于每一个所述待确认区域代表行为分布网络序列对应的序列重要度和对应的描述向量匹配度，分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数（示例性地，所述序列重要度和所述描述向量匹配度可以进行加权求和，以得到筛选优先系数，另外，所述序列重要度对应的加权系数可以小于所述描述向量匹配度对应的加权系数）。

另外，在一些实施方式中，所述目标行为关键信息挖掘神经网络的网络优化的步骤，可以包括：

针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络，基于所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量之间的区别信息，分析输出所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量（示例性地，可以对所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量进行向量求差处理，以输出对应的第二行为关键信息描述向量），所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量为所述多个代表行为关键信息描述向量中与所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量；

基于所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量，分析输出所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量，所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述示例性区域代表行为分布网络包括的示例性区域代表行为信息具有的行为关键信息（示例性地，可以通过所述目标行为关键信息挖掘神经网络包括的向量整合子网络，对所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量进行处理，以输出所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量，具体来说，所述向量整合子网络包括的每一个网络结点可以与上一个网络层的所有网络结点相连，用于将上一个网络层挖掘出的信息整合起来，如转化成一维的特征大向量，即所述第三行为关键信息描述向量可以是一维的）；

另外，在一些实施方式中，对于上述的利用初始的目标行为关键信息挖掘神经网络，挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量的步骤，可以包括：

针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络，利用初始的目标行为关键信息挖掘神经网络包括的浅层关键信息挖掘子网络对所述示例性区域代表行为分布网络进行第一关键信息挖掘处理，以输出所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量（示例性地，所述浅层关键信息挖掘子网络可以是一种卷积神经网络，以对所述示例性区域代表行为分布网络进行卷积运算，从而挖掘出对应的浅层行为关键信息描述向量）；

利用所述目标行为关键信息挖掘神经网络包括的深层关键信息挖掘子网络对所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量进行第二关键信息挖掘处理，以输出所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量（示例性地，所述深层关键信息挖掘子网络可以是一种特征压缩网络，用于对所述浅层行为关键信息描述向量进行特征特征处理，以形成对应的第一行为关键信息描述向量；具体来说，可以将所述浅层行为关键信息描述向量中的参数进行分块，然后，针对每一个参数块，基于该参数块包括的多个参数确定出该参数块的代表参数，最后，再将参数块用对应的代表参数进行替换，以实现特征压缩）。

另外，在一些实施方式中，对于上述的基于所述示例性区域代表行为分布网络簇包括的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量，分析输出对应的多个代表行为关键信息描述向量的步骤，可以包括：

对所述示例性区域代表行为分布网络簇中的多个示例性区域代表行为分布网络分别对应的第一行为关键信息描述向量进行聚合操作，以形成对应的多个第一行为关键信息描述向量聚合簇；

分别在每一个所述第一行为关键信息描述向量聚合簇中，将所述第一行为关键信息描述向量聚合簇中属于簇中间的示例性区域代表行为分布网络对应的第一行为关键信息描述向量（如后文所述的聚合操作对比参数对应的示例性区域代表行为分布网络对应的第一行为关键信息描述向量，或者，也可以是与其它第一行为关键信息描述向量之间的描述向量匹配度的平均值最大的一个第一行为关键信息描述向量），以标记为所述第一行为关键信息描述向量聚合簇对应的代表行为关键信息描述向量。

另外，在一些实施方式中，对于上述的对所述示例性区域代表行为分布网络簇中的多个示例性区域代表行为分布网络分别对应的第一行为关键信息描述向量进行聚合操作，以形成对应的多个第一行为关键信息描述向量聚合簇的步骤，可以包括：

在所述示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中，任意选择出第一数量个示例性区域代表行为分布网络，以标记为聚合操作对比参数（所述第一数量的具体数值不受限制）；

针对所述示例性区域代表行为分布网络簇包括的每一个示例性区域代表行为分布网络，对所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述第一数量个聚合操作对比参数对应的第一行为关键信息描述向量之间的描述向量匹配度；

将对应的所述描述向量匹配度具有最大值的聚合操作对比参数，标记为所述示例性区域代表行为分布网络对应的聚合操作对比参数（例如，可以将一个聚合操作对比参数和该聚合操作对比参数对应的所述示例性区域代表行为分布网络组合形成一个初始行为关键信息描述向量聚合簇）；

回转执行所述在所述示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中，任意选择出第一数量个示例性区域代表行为分布网络，以标记为聚合操作对比参数的步骤，并在多次执行所述将对应的所述描述向量匹配度具有最大值的聚合操作对比参数，标记为所述示例性区域代表行为分布网络对应的聚合操作对比参数的步骤之后，针对每一次执行的该步骤，依据该步骤对应的每一个聚合操作对比参数对应的第一行为关键信息描述向量与该聚合操作对比参数对应的示例性区域代表行为分布网络对应的第一行为关键信息描述向量之间的描述向量匹配度，确定出该步骤对应的目标筛选系数（示例性地，所述目标筛选系数可以与该描述向量匹配度的均值正相关，该描述向量匹配度的均值可以是指，对每一个初始行为关键信息描述向量聚合簇内部各第一行为关键信息描述向量之间的描述向量匹配度进行均值计算，再对每一个初始行为关键信息描述向量聚合簇对应的该均值进行均值计算），再依据具有最大值的目标筛选系数对应的步骤对应的第一数量个聚合操作对比参数，确定出对应的第一数量个第一行为关键信息描述向量聚合簇（即该步骤对应的多个初始行为关键信息描述向量聚合簇），以得到多个第一行为关键信息描述向量聚合簇。

另外，在一些实施方式中，对于上述的基于所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量，分析输出所述目标行为关键信息挖掘神经网络对应的神经网络目标学习代价值，再基于所述神经网络目标学习代价值对所述初始的目标行为关键信息挖掘神经网络进行网络优化处理的步骤，进一步可以包括以下具体的内容：

在所述示例性区域代表行为分布网络簇包括的多个所述示例性区域代表行为分布网络中，抽选出多个示例性分布网络组合，所述多个示例性分布网络组合包括多个第一示例性分布网络组合和多个第二示例性分布网络组合，每一个所述第一示例性分布网络组合包括的两个示例性区域代表行为分布网络相互匹配，每一个所述第二示例性分布网络组合包括的两个示例性区域代表行为分布网络不匹配；

基于所述第一示例性分布网络组合包括的两个示例性区域代表行为分布网络对应的第三行为关键信息描述向量之间的区别程度，并结合所述第二示例性分布网络组合包括的两个示例性区域代表行为分布网络的第三行为关键信息描述向量之间的区别程度，分析输出所述目标行为关键信息挖掘神经网络对应的神经网络目标学习代价值（示例性地，可以先所述第一示例性分布网络组合包括的两个示例性区域代表行为分布网络对应的第三行为关键信息描述向量之间的向量距离，以作为对应的区别程度，再计算所述第二示例性分布网络组合包括的两个示例性区域代表行为分布网络的第三行为关键信息描述向量之间的向量距离，以作为对应的区别程度，再计算该两个区别程度之间的差值，如前者减去后者，之后，基于该差值确定出所述神经网络目标学习代价值，其中，所述神经网络目标学习代价值可以与该差值之间具有正相关的对应关系）；

基于所述神经网络目标学习代价值对所述初始的目标行为关键信息挖掘神经网络进行网络优化处理（具体的网络优化处理的过程不受限制，可以参照相关的现有技术即可，只要使得所述神经网络目标学习代价值小于预先配置的学习代价参考值即可）。

另外，在一些实施方式中，对于上述的在所述示例性区域代表行为分布网络簇包括的多个所述示例性区域代表行为分布网络中，抽选出多个示例性分布网络组合的步骤，可以包括：

基于示例性区域代表行为分布网络之间是否匹配，对所述示例性区域代表行为分布网络簇包括的多个所述示例性区域代表行为分布网络进行分类处理，以形成对应的多个示例性区域代表行为分布网络匹配集合，每一个所述示例性区域代表行为分布网络匹配集合包括任意两个示例性区域代表行为分布网络之间匹配，每两个所述示例性区域代表行为分布网络匹配集合包括任意两个示例性区域代表行为分布网络之间不匹配（示例性地，两个示例性区域代表行为分布网络之间是否匹配，可以基于所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量之间的描述向量匹配度与预先配置的匹配度参考值之间的大小关系确定）；

分别在每一个所述示例性区域代表行为分布网络匹配集合中抽选出任意的两个示例性区域代表行为分布网络，组合为一个第一示例性分布网络组合，以形成多个第一示例性分布网络组合；

分别在每两个所述示例性区域代表行为分布网络匹配集合中抽选出任意的两个示例性区域代表行为分布网络，组合为一个第二示例性分布网络组合，以形成多个第二示例性分布网络组合；

基于所述多个第一示例性分布网络组合和所述多个第二示例性分布网络组合，形成多个示例性分布网络组合。

另外，在一些实施方式中，对于上述的分别在每两个所述示例性区域代表行为分布网络匹配集合中抽选出任意的两个示例性区域代表行为分布网络，组合为一个第二示例性分布网络组合，以形成多个第二示例性分布网络组合的步骤，可以包括：

针对所述多个示例性区域代表行为分布网络匹配集合中的第一示例性区域代表行为分布网络匹配集合，在所述第一示例性区域代表行为分布网络匹配集合中，筛选出一个示例性区域代表行为分布网络，以标记为第一示例性区域代表行为分布网络；

在所述第一示例性区域代表行为分布网络匹配集合以外的其它示例性区域代表行为分布网络匹配集合中，分别抽选出至少一个示例性区域代表行为分布网络，以标记为所述第一示例性区域代表行为分布网络对应的非匹配示例性区域代表行为分布网络；

分别计算所述第一示例性区域代表行为分布网络和每一个所述非匹配示例性区域代表行为分布网络之间的分布网络匹配度（所述分布网络匹配度可以是指，对应的第三行为关键信息描述向量之间的描述向量匹配度）；

将对应的所述分布网络匹配度具有最小值的至少一个非匹配示例性区域代表行为分布网络，和所述第一示例性区域代表行为分布网络进行组合，以形成至少一个第二示例性分布网络组合；

在所述多个示例性区域代表行为分布网络匹配集合分别作为所述第一示例性区域代表行为分布网络匹配集合以形成对应的至少一个第二示例性分布网络组合之后，形成所述多个示例性区域代表行为分布网络匹配集合对应的多个第二示例性分布网络组合。

另外，在一些实施方式中，对于上述的步骤S130，可以包括：

获取所述目标区域代表行为分布网络序列和所述匹配区域代表行为分布网络序列之间的序列匹配程度（所述序列匹配程度可以等于，对应的目标行为关键信息描述向量之间的描述向量匹配度）；

结合图3，本申请实施例还提供一种基于大数据的关联性分析方法，可应用于上述基于大数据的数据分析平台。其中，所述基于大数据的关联性分析方法有关的流程所定义的方法步骤，可以由所述基于大数据的数据分析平台实现。下面将对图3所示的具体流程，进行详细阐述。

对于目标行为数据库包括多个区域代表行为分布网络序列中的每一个区域代表行为分布网络序列，将该区域代表行为分布网络序列作为目标区域代表行为分布网络序列，并将该区域代表行为分布网络序列以外的每一个区域代表行为分布网络序列作为参考区域代表行为分布网络序列（每一个所述区域代表行为分布网络序列的形成方式可以参照上述的基于大数据的数据分析方法包括的步骤S110的解释说明）；

依据包括的区域代表行为信息，从所述目标行为数据库包括的多个参考区域代表行为分布网络序列中，筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列（此步骤，可以包括上述的基于大数据的数据分析方法包括的步骤S120的全部内容）；

将所述多个区域代表行为分布网络序列对应的多个区域进行关联处理，以形成所述多个区域对应的区域关联网络，在所述区域关联网络中，具有关联关系的两个区域对应的两个区域代表行为分布网络序列之间具有匹配关系（即一个作为所述目标区域代表行为分布网络序列时，另一个作为对应的匹配区域代表行为分布网络序列）。

综上所述，本申请提供的一种基于大数据的数据分析方法和平台，基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，构建出对应的目标区域代表行为分布网络序列；依据包括的区域代表行为信息，从多个参考区域代表行为分布网络序列中，筛选出与目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列；对目标区域和匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在目标区域和其它区域之间形成关联关系。基于上述步骤，由于是基于区域对应的代表行为信息进行关联分析，而代表行为信息的信息丰富度更高，使得相较于简单地基于地理位置来进行关联分析的常规技术方案，分析依据更为充分，从而可以在一定程度上提高关联关系确定的可靠度，进而改善现有技术中存在的可靠度不高的问题。

以上所述仅为本申请的优选实施例而已，并不用于限制本申请，对于本领域的技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原则之内，所作的任何修改、等同替换、改进等，均应包含在本申请的保护范围之内。

Claims

1.一种基于大数据的数据分析方法，其特征在于，包括：

2.根据权利要求1所述的基于大数据的数据分析方法，其特征在于，所述基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息，构建出所述目标区域对应的目标区域代表行为分布网络序列的步骤，包括：

3.根据权利要求1所述的基于大数据的数据分析方法，其特征在于，所述依据包括的区域代表行为信息，从目标行为数据库包括的多个参考区域代表行为分布网络序列中，筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列，作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤，包括：

4.根据权利要求3所述的基于大数据的数据分析方法，其特征在于，所述基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量，分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量的步骤，包括：

5.根据权利要求3所述的基于大数据的数据分析方法，其特征在于，所述基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量，在所述目标行为数据库中，筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列，并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤，包括：

6.根据权利要求5所述的基于大数据的数据分析方法，其特征在于，所述依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量，分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数的步骤，包括：

7.根据权利要求3所述的基于大数据的数据分析方法，其特征在于，所述目标行为关键信息挖掘神经网络的网络优化的步骤，包括：

8.根据权利要求7所述的基于大数据的数据分析方法，其特征在于，所述利用初始的目标行为关键信息挖掘神经网络，挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量的步骤，包括：

9.根据权利要求1-8任意一项所述的基于大数据的数据分析方法，其特征在于，所述对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理，以在所述目标区域和所述其它区域之间形成关联关系的步骤，包括：

10.一种基于大数据的数据分析平台，其特征在于，包括处理器和存储器，所述存储器用于存储计算机程序，所述处理器用于执行所述计算机程序，以实现权利要求1-9任意一项所述的基于大数据的数据分析方法。