CN115828011A - 基于大数据的数据分析方法和平台 - Google Patents
基于大数据的数据分析方法和平台 Download PDFInfo
- Publication number
- CN115828011A CN115828011A CN202211254667.5A CN202211254667A CN115828011A CN 115828011 A CN115828011 A CN 115828011A CN 202211254667 A CN202211254667 A CN 202211254667A CN 115828011 A CN115828011 A CN 115828011A
- Authority
- CN
- China
- Prior art keywords
- distribution network
- behavior
- target
- key information
- representative behavior
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000007405 data analysis Methods 0.000 title claims abstract description 36
- 238000000034 method Methods 0.000 title claims abstract description 32
- 238000009826 distribution Methods 0.000 claims abstract description 532
- 238000012216 screening Methods 0.000 claims abstract description 36
- 238000012545 processing Methods 0.000 claims abstract description 33
- 230000006399 behavior Effects 0.000 claims description 880
- 239000013598 vector Substances 0.000 claims description 251
- 238000005065 mining Methods 0.000 claims description 53
- 238000013528 artificial neural network Methods 0.000 claims description 45
- 238000005457 optimization Methods 0.000 claims description 11
- 238000004364 calculation method Methods 0.000 claims description 4
- 238000004590 computer program Methods 0.000 claims description 4
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 230000003542 behavioural effect Effects 0.000 claims 1
- 230000000875 corresponding effect Effects 0.000 description 259
- 230000002776 aggregation Effects 0.000 description 25
- 238000004220 aggregation Methods 0.000 description 25
- 238000004458 analytical method Methods 0.000 description 12
- 238000003672 processing method Methods 0.000 description 8
- 230000008569 process Effects 0.000 description 6
- 238000012517 data analytics Methods 0.000 description 5
- 238000004891 communication Methods 0.000 description 3
- 238000003860 storage Methods 0.000 description 3
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000010354 integration Effects 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 230000001276 controlling effect Effects 0.000 description 1
- 238000013527 convolutional neural network Methods 0.000 description 1
- 230000002596 correlated effect Effects 0.000 description 1
- 238000010586 diagram Methods 0.000 description 1
- 230000006872 improvement Effects 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 239000011159 matrix material Substances 0.000 description 1
- 230000006855 networking Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000007787 solid Substances 0.000 description 1
Images
Classifications
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02D—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
- Y02D10/00—Energy efficient computing, e.g. low power processors, power management or thermal management
Landscapes
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本申请提供的基于大数据的数据分析方法和平台,涉及大数据技术领域。在本申请中,基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出对应的目标区域代表行为分布网络序列;依据包括的区域代表行为信息,从多个参考区域代表行为分布网络序列中,筛选出与目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列;对目标区域和匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在目标区域和其它区域之间形成关联关系。基于上述步骤,可以在一定程度上提高关联关系确定的可靠度。
Description
技术领域
本申请涉及大数据技术领域,具体而言,涉及一种基于大数据的数据分析方法和平台。
背景技术
确定出不同对象之间是否具有关联关系,或者,在多个其它对象中确定出与目标对象之间具有关联关系的相关其它对象,在诸多领域和场景中都有应用。例如,针对一个区域,可能需要在多个其它区域中确定出与这一个区域具有关联关系的相关其它区域。但是,在现有技术中,一般是基于区域之间的地理位置来确定是否具有相关关系,使得其可靠度并不高。
发明内容
有鉴于此,本申请的目的在于提供一种基于大数据的数据分析方法和平台,以在一定程度上提高关联关系确定的可靠度。
为实现上述目的,本申请实施例采用如下技术方案:
一种基于大数据的数据分析,包括:
基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出所述目标区域对应的目标区域代表行为分布网络序列,所述目标区域代表行为分布网络序列包括多个目标区域代表行为分布网络,所述多个目标区域代表行为分布网络和所述多个历史时间一一对应,每一个所述目标区域代表行为分布网络包括多条目标区域代表行为信息,该多条目标区域代表行为信息和所述多个目标子区域一一对应;
依据包括的区域代表行为信息,从目标行为数据库包括的多个参考区域代表行为分布网络序列中,筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列;
对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系。
在一种可能的实施例中,在上述基于大数据的金融业务处理方法中,所述基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出所述目标区域对应的目标区域代表行为分布网络序列的步骤,包括:
提取到目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,一条所述目标区域代表行为信息基于从一个目标子区域在一个历史时间下具有的至少一条区域行为信息筛选出;
依据对应的历史时间是否相同,对所述目标区域代表行为信息进行分类处理,以形成所述多个历史时间对应的多个目标区域代表行为信息集合,以及,对于每一个所述目标区域代表行为信息集合,将该目标区域代表行为信息集合包括的每一条目标区域代表行为信息按照对应的目标子区域进行分布,以构建出对应的目标区域代表行为分布网络;
按照对应的历史时间,对所述目标区域代表行为分布网络进行排序,以形成所述目标区域对应的目标区域代表行为分布网络序列。
在一种可能的实施例中,在上述基于大数据的金融业务处理方法中,所述依据包括的区域代表行为信息,从目标行为数据库包括的多个参考区域代表行为分布网络序列中,筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤,包括:
在目标区域代表行为分布网络序列中,抽选出多个目标区域代表行为分布网络,该多个目标区域代表行为分布网络为所述目标区域代表行为分布网络序列包括的各目标区域代表行为分布网络中的至少部分;
针对每一个所述目标区域代表行为分布网络,利用预先进行网络优化形成的目标行为关键信息挖掘神经网络,挖掘出所述目标区域代表行为分布网络对应的第一行为关键信息描述向量;
在多个代表行为关键信息描述向量中,抽选出所述目标区域代表行为分布网络对应的相关代表行为关键信息描述向量,所述相关代表行为关键信息描述向量为与所述目标区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量,每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量;
基于所述目标区域代表行为分布网络对应的第一行为关键信息描述向量与对应的所述相关代表行为关键信息描述向量之间的区别信息,分析输出所述目标区域代表行为分布网络对应的第二行为关键信息描述向量;
利用所述目标行为关键信息挖掘神经网络,基于所述目标区域代表行为分布网络对应的第二行为关键信息描述向量,分析输出所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,所述目标区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述目标区域代表行为分布网络包括的目标区域代表行为信息具有的行为关键信息;
基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量;
基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列,并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。
在一种可能的实施例中,在上述基于大数据的金融业务处理方法中,所述基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量的步骤,包括:
对所述目标区域代表行为分布网络进行类型确定处理,以形成对应的多种行为分布网络类型信息,每一种所述行为分布网络类型信息对应有至少一个目标区域代表行为分布网络;
分别对每一种所述行为分布网络类型信息对应的目标区域代表行为分布网络对应的第三行为关键信息描述向量进行分类处理,以形成每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量;
基于每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量。
在一种可能的实施例中,在上述基于大数据的金融业务处理方法中,所述基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列,并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤,包括:
基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,抽取出多个参考区域代表行为分布网络序列,以标记为所述目标区域代表行为分布网络序列对应的待确认区域代表行为分布网络序列;
依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数;
基于每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数之间具有的相对大小信息,在所述待确认区域代表行为分布网络序列中,抽选出一个待确认区域代表行为分布网络序列作为第一参考区域代表行为分布网络序列,并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。
在一种可能的实施例中,在上述基于大数据的金融业务处理方法中,所述依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数的步骤,包括:
对于每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,对该待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量和所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量进行匹配度计算,以输出对应的描述向量匹配度;
分别统计每一个所述待确认区域代表行为分布网络序列包括的参考区域代表行为分布网络的数量,再分别基于该数量确定出每一个所述待确认区域代表行为分布网络序列对应的序列重要度;
分别基于每一个所述待确认区域代表行为分布网络序列对应的序列重要度和对应的描述向量匹配度,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数。
在一种可能的实施例中,在上述基于大数据的金融业务处理方法中,所述目标行为关键信息挖掘神经网络的网络优化的步骤,包括:
利用初始的目标行为关键信息挖掘神经网络,挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量;
基于所述示例性区域代表行为分布网络簇包括的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量,分析输出对应的多个代表行为关键信息描述向量,每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量,所述示例性区域代表行为分布网络簇对应有多个行为分布网络分类簇;
针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络,基于所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量之间的区别信息,分析输出所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量,所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量为所述多个代表行为关键信息描述向量中与所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量;
基于所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量,分析输出所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量,所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述示例性区域代表行为分布网络包括的示例性区域代表行为信息具有的行为关键信息;
基于所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标行为关键信息挖掘神经网络对应的神经网络目标学习代价值,再基于所述神经网络目标学习代价值对所述初始的目标行为关键信息挖掘神经网络进行网络优化处理。
在一种可能的实施例中,在上述基于大数据的金融业务处理方法中,所述利用初始的目标行为关键信息挖掘神经网络,挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量的步骤,包括:
针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络,利用初始的目标行为关键信息挖掘神经网络包括的浅层关键信息挖掘子网络对所述示例性区域代表行为分布网络进行第一关键信息挖掘处理,以输出所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量;
利用所述目标行为关键信息挖掘神经网络包括的深层关键信息挖掘子网络对所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量进行第二关键信息挖掘处理,以输出所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量。
在一种可能的实施例中,在上述基于大数据的金融业务处理方法中,所述对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系的步骤,包括:
获取所述目标区域代表行为分布网络序列和所述匹配区域代表行为分布网络序列之间的序列匹配程度;
基于所述序列匹配程度对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系,所述关联关系表征的关联度等于所述序列匹配程度。
本申请还提供一种基于大数据的数据分析平台,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现上述的基于大数据的数据分析方法。
本申请提供的一种基于大数据的数据分析方法和平台,基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出对应的目标区域代表行为分布网络序列;依据包括的区域代表行为信息,从多个参考区域代表行为分布网络序列中,筛选出与目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列;对目标区域和匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在目标区域和其它区域之间形成关联关系。基于上述步骤,由于是基于区域对应的代表行为信息进行关联分析,而代表行为信息的信息丰富度更高,使得相较于简单地基于地理位置来进行关联分析的常规技术方案,分析依据更为充分,从而可以在一定程度上提高关联关系确定的可靠度。
为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
图1为本申请实施例提供的基于大数据的数据分析平台的结构框图。
图2为本申请实施例提供的基于大数据的数据分析方法包括的各步骤的流程示意图。
图3为本申请实施例提供的基于大数据的关联性分析方法包括的各步骤的流程示意图。
具体实施方式
为使本申请实施例的目的、技术方案和优点更加清楚,下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例只是本申请的一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
图1示出了一种基于大数据的数据分析平台(如一种具备数据处理能力的服务器),其中,所述基于大数据的数据分析平台包括总线或者用于通信信息的其它通信组件、和耦合至总线的用于处理信息的处理器。其中,所述基于大数据的数据分析平台还可以包括耦合至总线的用于存储信息的主存储器(诸如,随机存取存储器(RAM)或者其它动态存储设备)和待由处理器执行的指令。主存储器还可以用于存储位置信息、临时变量、或者在处理器执行指令期间的其它中间信息。其中,所述基于大数据的数据分析平台还可以进一步包括只读存储器(ROM)或者耦合至总线的用于存储用于处理器的静态信息和指令的其它静态存储设备。存储设备(诸如,固态设备、磁盘或者光盘)被耦合至总线以便持久地存储信息和指令。
另外,在一些实施方式中,可以经由总线来将所述基于大数据的数据分析平台耦合至显示器(诸如,液晶显示器、或者有源矩阵显示器)以便向用户显示信息。另外,在一些实施方式中,可以将输入设备(诸如,包括字母数字键和其它键的键盘)耦合至总线以便向处理器通信信息和命令选择。另外,在一些实施方式中,输入设备可以具有触摸屏显示器。另外,在一些实施方式中,输入设备可以包括用于向处理器通信方向信息和命令选择以及用于控制在显示器上的光标移动的光标控件(诸如,鼠标、轨迹球、或者光标方向键)。
另外,在一些实施方式中,所述基于大数据的数据分析平台可以包括通信适配器(网络适配器)。另外,在各种说明性实施方式中,可以使用通信适配器来实现任何类型的组网配置,诸如,有线、无线、预配置、对等点对点、LAN、WAN等。
可以理解的是,虽然已经在图1中对示例处理系统进行了描述,但是可以通过使用其它类型的数字电子电路系统、或者在计算机软件、固件、或者硬件中(包括本说明书所公开的结构及其结构等效物)、或者它们中的一个或者多个的组合中实现本说明书中描述的主题的实施方式和功能操作,如后文所述的基于大数据的数据分析方法。
结合图2,本申请实施例还提供一种基于大数据的数据分析方法,可应用于上述基于大数据的数据分析平台。其中,所述基于大数据的数据分析方法有关的流程所定义的方法步骤,可以由所述基于大数据的数据分析平台实现。下面将对图2所示的具体流程,进行详细阐述。
步骤S110,基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出所述目标区域对应的目标区域代表行为分布网络序列。
在本发明实施例中,所述基于大数据的数据分析平台可以基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出所述目标区域对应的目标区域代表行为分布网络序列。所述目标区域代表行为分布网络序列包括多个目标区域代表行为分布网络,所述多个目标区域代表行为分布网络和所述多个历史时间一一对应,每一个所述目标区域代表行为分布网络包括多条目标区域代表行为信息,该多条目标区域代表行为信息和所述多个目标子区域一一对应。
步骤S120,依据包括的区域代表行为信息,从目标行为数据库包括的多个参考区域代表行为分布网络序列中,筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。
在本发明实施例中,所述基于大数据的数据分析平台可以依据包括的区域代表行为信息,从目标行为数据库包括的多个参考区域代表行为分布网络序列中,筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。
步骤S130,对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系。
在本发明实施例中,所述基于大数据的数据分析平台可以对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系,实现区域关联。
基于此,由于是基于区域对应的代表行为信息进行关联分析,而代表行为信息的信息丰富度更高,使得相较于简单地基于地理位置来进行关联分析的常规技术方案,分析依据更为充分,从而可以在一定程度上提高关联关系确定的可靠度,进而改善现有技术中存在的可靠度不高的问题。
另外,在一些实施方式中,对于上述的步骤S110,可以包括:
提取到目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,一条所述目标区域代表行为信息基于从一个目标子区域在一个历史时间下具有的至少一条区域行为信息筛选出(一条区域行为信息可以是指互联网行为,也可以是指物理世界的行为等);
依据对应的历史时间是否相同,对所述目标区域代表行为信息进行分类处理,以形成所述多个历史时间对应的多个目标区域代表行为信息集合,以及,对于每一个所述目标区域代表行为信息集合,将该目标区域代表行为信息集合包括的每一条目标区域代表行为信息按照对应的目标子区域(的位置坐标)进行分布,以构建出对应的目标区域代表行为分布网络;
按照对应的历史时间,对所述目标区域代表行为分布网络进行排序,以形成所述目标区域对应的目标区域代表行为分布网络序列(如此,使得所述目标区域代表行为分布网络序列中的目标区域代表行为信息不仅具有对应的行为信息,还携带有不同行为之间的时间关系和位置关系,使得所述目标区域代表行为分布网络序列的内容更为丰富)。
另外,在一些实施方式中,对于上述的所述一条所述目标区域代表行为信息基于从一个目标子区域在一个历史时间下具有的至少一条区域行为信息筛选出,其具体的实现过程,可以包括:
提取出一个目标子区域在一个历史时间下具有的多条区域互联网行为信息,每一条所述区域互联网行为信息用于反映对应的一个互联网用户再所述历史时间下进行的一个互联网行为(如浏览文章、观看视频、游戏等);
基于对应的行为类型,对所述多条区域互联网行为信息进行分类处理,以形成对应的至少一种类型分类集合,每一个所述类型分类集合包括至少一条区域互联网行为信息,同一个所述类型分类集合中的每两条区域互联网行为信息对应的行为类型相同(如都是浏览文章),不同所述类型分类集合中的每两条区域互联网行为信息对应的行为类型不同(如一个对应的行为类型为浏览文字,另一个对应的行为类型为观看视频);
提取出预先配置的多条互联网行为序列,每一条所述互联网行为序列基于对应的一个互联网用户在多个历史时间下的多个历史互联网行为构成,且该多个历史互联网行为按照对应的历史时间的先后进行排序;
对于每一条所述互联网行为序列,提取出该互联网行为序列包括的每一个历史互联网行为的行为类型,以构建形成该互联网行为序列对应的行为类型序列,所述多条互联网行为序列对应有多条行为类型序列;
对于每一种所述类型分类集合,在所述多条行为类型序列中,确定出包括该类型分类集合对应的行为类型的每一条行为类型序列,并标记为该类型分类集合对应的相关行为类型序列,并统计该类型分类集合对应的相关行为类型序列的数量,以得到该类型分类集合对应的相关序列统计数量,以及,确定该类型分类集合对应的行为类型分别在对应的每一条相关行为类型序列中的序列位置和序列中间位置之间的位置距离,并对该位置距离进行均值计算,以得到该类型分类集合对应的代表位置距离;
对于每一种所述类型分类集合,依据该类型分类集合对应的相关序列统计数量,确定出该类型分类集合对应的第一重要系数,再依据该类型分类集合对应的代表位置距离,确定出该类型分类集合对应的第二重要系数,所述第一重要系数与所述相关序列统计数量之间具有正相关的关系,所述第二重要系数与所述代表位置距离之间具有负相关的关系,以及,对该第一重要系数和该第二重要系数进行加权求和,以得到该类型分类集合对应的目标重要系数,在进行加权求和的过程中,所述第一重要系数对应的权重值可以大于所述第二重要系数对应的权重值;
将对应的目标重要系数最大的目标数量个类型分类集合(所述目标数量的具体数值不受限制,如2、3、4、5等数值),标记为目标类型分类集合,以得到目标数量个目标类型分类集合;以及,针对每一个所述目标类型分类集合,从该目标类型分类集合中提取出对应的行为持续时间最长的一条区域互联网行为信息,作为该目标类型分类集合对应的目标区域互联网行为信息,以及,基于对应的目标重要系数的大小关系,对每一个所述目标类型分类集合对应的目标区域互联网行为信息进行顺序拼接,以形成对应的一条目标区域代表行为信息(如“做A、做B、做C”等)。
另外,在一些实施方式中,对于上述的步骤S120,可以包括:
在目标区域代表行为分布网络序列中,抽选出多个目标区域代表行为分布网络,该多个目标区域代表行为分布网络为所述目标区域代表行为分布网络序列包括的各目标区域代表行为分布网络中的至少部分(即可以时其中的一部分目标区域代表行为分布网络,也可以是其中的全部目标区域代表行为分布网络,根据实际需求进行配置即可);
针对每一个所述目标区域代表行为分布网络,利用预先进行网络优化形成的目标行为关键信息挖掘神经网络,挖掘出所述目标区域代表行为分布网络对应的第一行为关键信息描述向量(示例性地,可以利用所述目标行为关键信息挖掘神经网络包括的浅层关键信息挖掘子网络对目标区域代表行为分布网络进行处理,得到目标区域代表行为分布网络对应的浅层行为关键信息描述向量;然后,再利用所述目标行为关键信息挖掘神经网络包括的深层关键信息挖掘子网络对目标区域代表行为分布网络对应的浅层行为关键信息描述向量进行处理,从而输出所述目标区域代表行为分布网络对应的第一行为关键信息描述向量);
在多个代表行为关键信息描述向量中,抽选出所述目标区域代表行为分布网络对应的相关代表行为关键信息描述向量,所述相关代表行为关键信息描述向量为与所述目标区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量,每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量(所述行为分布网络分类簇可以是对多个示例性区域代表行为分布网络进行分类形成);
基于所述目标区域代表行为分布网络对应的第一行为关键信息描述向量与对应的所述相关代表行为关键信息描述向量之间的区别信息,分析输出所述目标区域代表行为分布网络对应的第二行为关键信息描述向量(示例性地,可以对所述目标区域代表行为分布网络对应的第一行为关键信息描述向量和对应的所述相关代表行为关键信息描述向量进行向量求差处理,以得到对应的第二行为关键信息描述向量);
利用所述目标行为关键信息挖掘神经网络,基于所述目标区域代表行为分布网络对应的第二行为关键信息描述向量,分析输出所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,所述目标区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述目标区域代表行为分布网络包括的目标区域代表行为信息具有的行为关键信息;
基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量(示例性地,可以对一些无效的描述向量进行筛除等);
基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列,并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。
另外,在一些实施方式中,对于上述的基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量的步骤,进一步可以包括以下的具体内容:
对所述目标区域代表行为分布网络进行类型确定处理,以形成对应的多种行为分布网络类型信息,每一种所述行为分布网络类型信息对应有至少一个目标区域代表行为分布网络(示例性地,可以基于对应的第三行为关键信息描述向量对所述目标区域代表行为分布网络进行分类,其中,同一个分类的目标区域代表行为分布网络,对应同一种行为分布网络类型信息,分类的原则可以是同一个分类的目标区域代表行为分布网络对应的第三行为关键信息描述向量之间的描述向量匹配度都大于预设匹配度);
分别对每一种所述行为分布网络类型信息对应的目标区域代表行为分布网络对应的第三行为关键信息描述向量进行分类处理,以形成每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量(示例性地,针对一种所述行为分布网络类型信息,可以依据对应的第三行为关键信息描述向量之间的描述向量匹配度,对该行为分布网络类型信息对应的至少一个目标区域代表行为分布网络进行分类中心的确定处理,如将与其它第三行为关键信息描述向量之间的描述向量匹配度的均值最大的第三行为关键信息描述向量作为分类中心第三行为关键信息描述向量);
基于每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量(示例性地,可以对每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量进行叠加或拼接,以形成所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量)。
另外,在一些实施方式中,对于上述的基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列,并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤,可以包括:
基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,抽取出多个参考区域代表行为分布网络序列,以标记为所述目标区域代表行为分布网络序列对应的待确认区域代表行为分布网络序列(示例性地,所述待确认区域代表行为分布网络序列可以是与所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量之间的描述向量匹配度最大的一定数量的多个参考区域代表行为分布网络序列);
依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数;
基于每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数之间具有的相对大小信息,在所述待确认区域代表行为分布网络序列中,抽选出一个待确认区域代表行为分布网络序列作为第一参考区域代表行为分布网络序列(如对应的筛选优先系数最大),并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。
另外,在一些实施方式中,对于上述的依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数的步骤,进一步可以包括以下具体内容:
对于每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,对该待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量和所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量进行匹配度计算,以输出对应的描述向量匹配度;
分别统计每一个所述待确认区域代表行为分布网络序列包括的参考区域代表行为分布网络的数量,再分别基于该数量确定出每一个所述待确认区域代表行为分布网络序列对应的序列重要度(示例性地,所述序列重要度和该数量之间可以具有正相关的对应关系);
分别基于每一个所述待确认区域代表行为分布网络序列对应的序列重要度和对应的描述向量匹配度,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数(示例性地,所述序列重要度和所述描述向量匹配度可以进行加权求和,以得到筛选优先系数,另外,所述序列重要度对应的加权系数可以小于所述描述向量匹配度对应的加权系数)。
另外,在一些实施方式中,所述目标行为关键信息挖掘神经网络的网络优化的步骤,可以包括:
利用初始的目标行为关键信息挖掘神经网络,挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量;
基于所述示例性区域代表行为分布网络簇包括的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量,分析输出对应的多个代表行为关键信息描述向量,每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量,所述示例性区域代表行为分布网络簇对应有多个行为分布网络分类簇;
针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络,基于所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量之间的区别信息,分析输出所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量(示例性地,可以对所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量进行向量求差处理,以输出对应的第二行为关键信息描述向量),所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量为所述多个代表行为关键信息描述向量中与所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量;
基于所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量,分析输出所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量,所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述示例性区域代表行为分布网络包括的示例性区域代表行为信息具有的行为关键信息(示例性地,可以通过所述目标行为关键信息挖掘神经网络包括的向量整合子网络,对所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量进行处理,以输出所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量,具体来说,所述向量整合子网络包括的每一个网络结点可以与上一个网络层的所有网络结点相连,用于将上一个网络层挖掘出的信息整合起来,如转化成一维的特征大向量,即所述第三行为关键信息描述向量可以是一维的);
基于所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标行为关键信息挖掘神经网络对应的神经网络目标学习代价值,再基于所述神经网络目标学习代价值对所述初始的目标行为关键信息挖掘神经网络进行网络优化处理。
另外,在一些实施方式中,对于上述的利用初始的目标行为关键信息挖掘神经网络,挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量的步骤,可以包括:
针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络,利用初始的目标行为关键信息挖掘神经网络包括的浅层关键信息挖掘子网络对所述示例性区域代表行为分布网络进行第一关键信息挖掘处理,以输出所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量(示例性地,所述浅层关键信息挖掘子网络可以是一种卷积神经网络,以对所述示例性区域代表行为分布网络进行卷积运算,从而挖掘出对应的浅层行为关键信息描述向量);
利用所述目标行为关键信息挖掘神经网络包括的深层关键信息挖掘子网络对所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量进行第二关键信息挖掘处理,以输出所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量(示例性地,所述深层关键信息挖掘子网络可以是一种特征压缩网络,用于对所述浅层行为关键信息描述向量进行特征特征处理,以形成对应的第一行为关键信息描述向量;具体来说,可以将所述浅层行为关键信息描述向量中的参数进行分块,然后,针对每一个参数块,基于该参数块包括的多个参数确定出该参数块的代表参数,最后,再将参数块用对应的代表参数进行替换,以实现特征压缩)。
另外,在一些实施方式中,对于上述的基于所述示例性区域代表行为分布网络簇包括的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量,分析输出对应的多个代表行为关键信息描述向量的步骤,可以包括:
对所述示例性区域代表行为分布网络簇中的多个示例性区域代表行为分布网络分别对应的第一行为关键信息描述向量进行聚合操作,以形成对应的多个第一行为关键信息描述向量聚合簇;
分别在每一个所述第一行为关键信息描述向量聚合簇中,将所述第一行为关键信息描述向量聚合簇中属于簇中间的示例性区域代表行为分布网络对应的第一行为关键信息描述向量(如后文所述的聚合操作对比参数对应的示例性区域代表行为分布网络对应的第一行为关键信息描述向量,或者,也可以是与其它第一行为关键信息描述向量之间的描述向量匹配度的平均值最大的一个第一行为关键信息描述向量),以标记为所述第一行为关键信息描述向量聚合簇对应的代表行为关键信息描述向量。
另外,在一些实施方式中,对于上述的对所述示例性区域代表行为分布网络簇中的多个示例性区域代表行为分布网络分别对应的第一行为关键信息描述向量进行聚合操作,以形成对应的多个第一行为关键信息描述向量聚合簇的步骤,可以包括:
在所述示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中,任意选择出第一数量个示例性区域代表行为分布网络,以标记为聚合操作对比参数(所述第一数量的具体数值不受限制);
针对所述示例性区域代表行为分布网络簇包括的每一个示例性区域代表行为分布网络,对所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述第一数量个聚合操作对比参数对应的第一行为关键信息描述向量之间的描述向量匹配度;
将对应的所述描述向量匹配度具有最大值的聚合操作对比参数,标记为所述示例性区域代表行为分布网络对应的聚合操作对比参数(例如,可以将一个聚合操作对比参数和该聚合操作对比参数对应的所述示例性区域代表行为分布网络组合形成一个初始行为关键信息描述向量聚合簇);
回转执行所述在所述示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中,任意选择出第一数量个示例性区域代表行为分布网络,以标记为聚合操作对比参数的步骤,并在多次执行所述将对应的所述描述向量匹配度具有最大值的聚合操作对比参数,标记为所述示例性区域代表行为分布网络对应的聚合操作对比参数的步骤之后,针对每一次执行的该步骤,依据该步骤对应的每一个聚合操作对比参数对应的第一行为关键信息描述向量与该聚合操作对比参数对应的示例性区域代表行为分布网络对应的第一行为关键信息描述向量之间的描述向量匹配度,确定出该步骤对应的目标筛选系数(示例性地,所述目标筛选系数可以与该描述向量匹配度的均值正相关,该描述向量匹配度的均值可以是指,对每一个初始行为关键信息描述向量聚合簇内部各第一行为关键信息描述向量之间的描述向量匹配度进行均值计算,再对每一个初始行为关键信息描述向量聚合簇对应的该均值进行均值计算),再依据具有最大值的目标筛选系数对应的步骤对应的第一数量个聚合操作对比参数,确定出对应的第一数量个第一行为关键信息描述向量聚合簇(即该步骤对应的多个初始行为关键信息描述向量聚合簇),以得到多个第一行为关键信息描述向量聚合簇。
另外,在一些实施方式中,对于上述的基于所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标行为关键信息挖掘神经网络对应的神经网络目标学习代价值,再基于所述神经网络目标学习代价值对所述初始的目标行为关键信息挖掘神经网络进行网络优化处理的步骤,进一步可以包括以下具体的内容:
在所述示例性区域代表行为分布网络簇包括的多个所述示例性区域代表行为分布网络中,抽选出多个示例性分布网络组合,所述多个示例性分布网络组合包括多个第一示例性分布网络组合和多个第二示例性分布网络组合,每一个所述第一示例性分布网络组合包括的两个示例性区域代表行为分布网络相互匹配,每一个所述第二示例性分布网络组合包括的两个示例性区域代表行为分布网络不匹配;
基于所述第一示例性分布网络组合包括的两个示例性区域代表行为分布网络对应的第三行为关键信息描述向量之间的区别程度,并结合所述第二示例性分布网络组合包括的两个示例性区域代表行为分布网络的第三行为关键信息描述向量之间的区别程度,分析输出所述目标行为关键信息挖掘神经网络对应的神经网络目标学习代价值(示例性地,可以先所述第一示例性分布网络组合包括的两个示例性区域代表行为分布网络对应的第三行为关键信息描述向量之间的向量距离,以作为对应的区别程度,再计算所述第二示例性分布网络组合包括的两个示例性区域代表行为分布网络的第三行为关键信息描述向量之间的向量距离,以作为对应的区别程度,再计算该两个区别程度之间的差值,如前者减去后者,之后,基于该差值确定出所述神经网络目标学习代价值,其中,所述神经网络目标学习代价值可以与该差值之间具有正相关的对应关系);
基于所述神经网络目标学习代价值对所述初始的目标行为关键信息挖掘神经网络进行网络优化处理(具体的网络优化处理的过程不受限制,可以参照相关的现有技术即可,只要使得所述神经网络目标学习代价值小于预先配置的学习代价参考值即可)。
另外,在一些实施方式中,对于上述的在所述示例性区域代表行为分布网络簇包括的多个所述示例性区域代表行为分布网络中,抽选出多个示例性分布网络组合的步骤,可以包括:
基于示例性区域代表行为分布网络之间是否匹配,对所述示例性区域代表行为分布网络簇包括的多个所述示例性区域代表行为分布网络进行分类处理,以形成对应的多个示例性区域代表行为分布网络匹配集合,每一个所述示例性区域代表行为分布网络匹配集合包括任意两个示例性区域代表行为分布网络之间匹配,每两个所述示例性区域代表行为分布网络匹配集合包括任意两个示例性区域代表行为分布网络之间不匹配(示例性地,两个示例性区域代表行为分布网络之间是否匹配,可以基于所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量之间的描述向量匹配度与预先配置的匹配度参考值之间的大小关系确定);
分别在每一个所述示例性区域代表行为分布网络匹配集合中抽选出任意的两个示例性区域代表行为分布网络,组合为一个第一示例性分布网络组合,以形成多个第一示例性分布网络组合;
分别在每两个所述示例性区域代表行为分布网络匹配集合中抽选出任意的两个示例性区域代表行为分布网络,组合为一个第二示例性分布网络组合,以形成多个第二示例性分布网络组合;
基于所述多个第一示例性分布网络组合和所述多个第二示例性分布网络组合,形成多个示例性分布网络组合。
另外,在一些实施方式中,对于上述的分别在每两个所述示例性区域代表行为分布网络匹配集合中抽选出任意的两个示例性区域代表行为分布网络,组合为一个第二示例性分布网络组合,以形成多个第二示例性分布网络组合的步骤,可以包括:
针对所述多个示例性区域代表行为分布网络匹配集合中的第一示例性区域代表行为分布网络匹配集合,在所述第一示例性区域代表行为分布网络匹配集合中,筛选出一个示例性区域代表行为分布网络,以标记为第一示例性区域代表行为分布网络;
在所述第一示例性区域代表行为分布网络匹配集合以外的其它示例性区域代表行为分布网络匹配集合中,分别抽选出至少一个示例性区域代表行为分布网络,以标记为所述第一示例性区域代表行为分布网络对应的非匹配示例性区域代表行为分布网络;
分别计算所述第一示例性区域代表行为分布网络和每一个所述非匹配示例性区域代表行为分布网络之间的分布网络匹配度(所述分布网络匹配度可以是指,对应的第三行为关键信息描述向量之间的描述向量匹配度);
将对应的所述分布网络匹配度具有最小值的至少一个非匹配示例性区域代表行为分布网络,和所述第一示例性区域代表行为分布网络进行组合,以形成至少一个第二示例性分布网络组合;
在所述多个示例性区域代表行为分布网络匹配集合分别作为所述第一示例性区域代表行为分布网络匹配集合以形成对应的至少一个第二示例性分布网络组合之后,形成所述多个示例性区域代表行为分布网络匹配集合对应的多个第二示例性分布网络组合。
另外,在一些实施方式中,对于上述的步骤S130,可以包括:
获取所述目标区域代表行为分布网络序列和所述匹配区域代表行为分布网络序列之间的序列匹配程度(所述序列匹配程度可以等于,对应的目标行为关键信息描述向量之间的描述向量匹配度);
基于所述序列匹配程度对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系,所述关联关系表征的关联度等于所述序列匹配程度。
结合图3,本申请实施例还提供一种基于大数据的关联性分析方法,可应用于上述基于大数据的数据分析平台。其中,所述基于大数据的关联性分析方法有关的流程所定义的方法步骤,可以由所述基于大数据的数据分析平台实现。下面将对图3所示的具体流程,进行详细阐述。
对于目标行为数据库包括多个区域代表行为分布网络序列中的每一个区域代表行为分布网络序列,将该区域代表行为分布网络序列作为目标区域代表行为分布网络序列,并将该区域代表行为分布网络序列以外的每一个区域代表行为分布网络序列作为参考区域代表行为分布网络序列(每一个所述区域代表行为分布网络序列的形成方式可以参照上述的基于大数据的数据分析方法包括的步骤S110的解释说明);
依据包括的区域代表行为信息,从所述目标行为数据库包括的多个参考区域代表行为分布网络序列中,筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列(此步骤,可以包括上述的基于大数据的数据分析方法包括的步骤S120的全部内容);
将所述多个区域代表行为分布网络序列对应的多个区域进行关联处理,以形成所述多个区域对应的区域关联网络,在所述区域关联网络中,具有关联关系的两个区域对应的两个区域代表行为分布网络序列之间具有匹配关系(即一个作为所述目标区域代表行为分布网络序列时,另一个作为对应的匹配区域代表行为分布网络序列)。
综上所述,本申请提供的一种基于大数据的数据分析方法和平台,基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出对应的目标区域代表行为分布网络序列;依据包括的区域代表行为信息,从多个参考区域代表行为分布网络序列中,筛选出与目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列;对目标区域和匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在目标区域和其它区域之间形成关联关系。基于上述步骤,由于是基于区域对应的代表行为信息进行关联分析,而代表行为信息的信息丰富度更高,使得相较于简单地基于地理位置来进行关联分析的常规技术方案,分析依据更为充分,从而可以在一定程度上提高关联关系确定的可靠度,进而改善现有技术中存在的可靠度不高的问题。
以上所述仅为本申请的优选实施例而已,并不用于限制本申请,对于本领域的技术人员来说,本申请可以有各种更改和变化。凡在本申请的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本申请的保护范围之内。
Claims (10)
1.一种基于大数据的数据分析方法,其特征在于,包括:
基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出所述目标区域对应的目标区域代表行为分布网络序列,所述目标区域代表行为分布网络序列包括多个目标区域代表行为分布网络,所述多个目标区域代表行为分布网络和所述多个历史时间一一对应,每一个所述目标区域代表行为分布网络包括多条目标区域代表行为信息,该多条目标区域代表行为信息和所述多个目标子区域一一对应;
依据包括的区域代表行为信息,从目标行为数据库包括的多个参考区域代表行为分布网络序列中,筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列;
对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系。
2.根据权利要求1所述的基于大数据的数据分析方法,其特征在于,所述基于目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,构建出所述目标区域对应的目标区域代表行为分布网络序列的步骤,包括:
提取到目标区域包括的多个目标子区域分别在多个历史时间下具有的目标区域代表行为信息,一条所述目标区域代表行为信息基于从一个目标子区域在一个历史时间下具有的至少一条区域行为信息筛选出;
依据对应的历史时间是否相同,对所述目标区域代表行为信息进行分类处理,以形成所述多个历史时间对应的多个目标区域代表行为信息集合,以及,对于每一个所述目标区域代表行为信息集合,将该目标区域代表行为信息集合包括的每一条目标区域代表行为信息按照对应的目标子区域进行分布,以构建出对应的目标区域代表行为分布网络;
按照对应的历史时间,对所述目标区域代表行为分布网络进行排序,以形成所述目标区域对应的目标区域代表行为分布网络序列。
3.根据权利要求1所述的基于大数据的数据分析方法,其特征在于,所述依据包括的区域代表行为信息,从目标行为数据库包括的多个参考区域代表行为分布网络序列中,筛选出与所述目标区域代表行为分布网络序列匹配的参考区域代表行为分布网络序列,作为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤,包括:
在目标区域代表行为分布网络序列中,抽选出多个目标区域代表行为分布网络,该多个目标区域代表行为分布网络为所述目标区域代表行为分布网络序列包括的各目标区域代表行为分布网络中的至少部分;
针对每一个所述目标区域代表行为分布网络,利用预先进行网络优化形成的目标行为关键信息挖掘神经网络,挖掘出所述目标区域代表行为分布网络对应的第一行为关键信息描述向量;
在多个代表行为关键信息描述向量中,抽选出所述目标区域代表行为分布网络对应的相关代表行为关键信息描述向量,所述相关代表行为关键信息描述向量为与所述目标区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量,每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量;
基于所述目标区域代表行为分布网络对应的第一行为关键信息描述向量与对应的所述相关代表行为关键信息描述向量之间的区别信息,分析输出所述目标区域代表行为分布网络对应的第二行为关键信息描述向量;
利用所述目标行为关键信息挖掘神经网络,基于所述目标区域代表行为分布网络对应的第二行为关键信息描述向量,分析输出所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,所述目标区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述目标区域代表行为分布网络包括的目标区域代表行为信息具有的行为关键信息;
基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量;
基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列,并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。
4.根据权利要求3所述的基于大数据的数据分析方法,其特征在于,所述基于每一个所述目标区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量的步骤,包括:
对所述目标区域代表行为分布网络进行类型确定处理,以形成对应的多种行为分布网络类型信息,每一种所述行为分布网络类型信息对应有至少一个目标区域代表行为分布网络;
分别对每一种所述行为分布网络类型信息对应的目标区域代表行为分布网络对应的第三行为关键信息描述向量进行分类处理,以形成每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量;
基于每一种所述行为分布网络类型信息对应的分类中心第三行为关键信息描述向量,分析输出所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量。
5.根据权利要求3所述的基于大数据的数据分析方法,其特征在于,所述基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,筛选出满足目标匹配规则的第一参考区域代表行为分布网络序列,并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列的步骤,包括:
基于所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和目标行为数据库包括的每一个参考区域代表行为分布网络序列对应的目标行为关键信息描述向量,在所述目标行为数据库中,抽取出多个参考区域代表行为分布网络序列,以标记为所述目标区域代表行为分布网络序列对应的待确认区域代表行为分布网络序列;
依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数;
基于每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数之间具有的相对大小信息,在所述待确认区域代表行为分布网络序列中,抽选出一个待确认区域代表行为分布网络序列作为第一参考区域代表行为分布网络序列,并标记为所述目标区域代表行为分布网络序列对应的匹配区域代表行为分布网络序列。
6.根据权利要求5所述的基于大数据的数据分析方法,其特征在于,所述依据所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量和每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数的步骤,包括:
对于每一个所述待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量,对该待确认区域代表行为分布网络序列对应的目标行为关键信息描述向量和所述目标区域代表行为分布网络序列对应的目标行为关键信息描述向量进行匹配度计算,以输出对应的描述向量匹配度;
分别统计每一个所述待确认区域代表行为分布网络序列包括的参考区域代表行为分布网络的数量,再分别基于该数量确定出每一个所述待确认区域代表行为分布网络序列对应的序列重要度;
分别基于每一个所述待确认区域代表行为分布网络序列对应的序列重要度和对应的描述向量匹配度,分析输出每一个所述待确认区域代表行为分布网络序列对应的筛选优先系数。
7.根据权利要求3所述的基于大数据的数据分析方法,其特征在于,所述目标行为关键信息挖掘神经网络的网络优化的步骤,包括:
利用初始的目标行为关键信息挖掘神经网络,挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量;
基于所述示例性区域代表行为分布网络簇包括的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量,分析输出对应的多个代表行为关键信息描述向量,每一个所述代表行为关键信息描述向量用于代表一个行为分布网络分类簇包括的各示例性区域代表行为分布网络对应的第一行为关键信息描述向量,所述示例性区域代表行为分布网络簇对应有多个行为分布网络分类簇;
针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络,基于所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量和所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量之间的区别信息,分析输出所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量,所述示例性区域代表行为分布网络对应的相关代表行为关键信息描述向量为所述多个代表行为关键信息描述向量中与所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量相关度最大的代表行为关键信息描述向量;
基于所述示例性区域代表行为分布网络对应的第二行为关键信息描述向量,分析输出所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量,所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量用于代表所述示例性区域代表行为分布网络包括的示例性区域代表行为信息具有的行为关键信息;
基于所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络对应的第三行为关键信息描述向量,分析输出所述目标行为关键信息挖掘神经网络对应的神经网络目标学习代价值,再基于所述神经网络目标学习代价值对所述初始的目标行为关键信息挖掘神经网络进行网络优化处理。
8.根据权利要求7所述的基于大数据的数据分析方法,其特征在于,所述利用初始的目标行为关键信息挖掘神经网络,挖掘出示例性区域代表行为分布网络簇包括的多个示例性区域代表行为分布网络中的每一个示例性区域代表行为分布网络对应的第一行为关键信息描述向量的步骤,包括:
针对所述示例性区域代表行为分布网络簇包括的每一个所述示例性区域代表行为分布网络,利用初始的目标行为关键信息挖掘神经网络包括的浅层关键信息挖掘子网络对所述示例性区域代表行为分布网络进行第一关键信息挖掘处理,以输出所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量;
利用所述目标行为关键信息挖掘神经网络包括的深层关键信息挖掘子网络对所述示例性区域代表行为分布网络对应的浅层行为关键信息描述向量进行第二关键信息挖掘处理,以输出所述示例性区域代表行为分布网络对应的第一行为关键信息描述向量。
9.根据权利要求1-8任意一项所述的基于大数据的数据分析方法,其特征在于,所述对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系的步骤,包括:
获取所述目标区域代表行为分布网络序列和所述匹配区域代表行为分布网络序列之间的序列匹配程度;
基于所述序列匹配程度对所述目标区域和所述匹配区域代表行为分布网络序列对应的其它区域进行关联处理,以在所述目标区域和所述其它区域之间形成关联关系,所述关联关系表征的关联度等于所述序列匹配程度。
10.一种基于大数据的数据分析平台,其特征在于,包括处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于执行所述计算机程序,以实现权利要求1-9任意一项所述的基于大数据的数据分析方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211254667.5A CN115828011B (zh) | 2022-10-13 | 2022-10-13 | 基于大数据的数据分析方法和平台 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211254667.5A CN115828011B (zh) | 2022-10-13 | 2022-10-13 | 基于大数据的数据分析方法和平台 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115828011A true CN115828011A (zh) | 2023-03-21 |
CN115828011B CN115828011B (zh) | 2023-11-10 |
Family
ID=85524708
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211254667.5A Active CN115828011B (zh) | 2022-10-13 | 2022-10-13 | 基于大数据的数据分析方法和平台 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115828011B (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117176547A (zh) * | 2023-08-17 | 2023-12-05 | 鸿图百奥科技(广州)有限公司 | 一种通信设备的管控方法及系统 |
Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598557A (zh) * | 2015-01-05 | 2015-05-06 | 华为技术有限公司 | 数据栅格化、用户行为分析的方法和装置 |
US20170148043A1 (en) * | 2015-11-23 | 2017-05-25 | Institute For Information Industry | Location based community integration matchmaking system, method and computer readable recording media for optimizing sales |
CN106789136A (zh) * | 2015-11-19 | 2017-05-31 | 北大方正集团有限公司 | 基于用户行为的运营分析实现方法及装置 |
US20180033023A1 (en) * | 2016-07-28 | 2018-02-01 | Mastercard International Incorporated | Systems and methods for characterizing geographic regions |
CN113449012A (zh) * | 2021-06-20 | 2021-09-28 | 卢洪亮 | 基于大数据预测的互联网服务挖掘方法及大数据预测系统 |
CN113468432A (zh) * | 2021-08-02 | 2021-10-01 | 东莞市汇学汇玩教育科技有限公司 | 基于移动互联网的用户行为大数据分析方法及系统 |
CN113468604A (zh) * | 2021-08-02 | 2021-10-01 | 东莞市慧学慧玩教育科技有限公司 | 基于人工智能的大数据隐私信息解析方法及系统 |
CN113568952A (zh) * | 2021-07-30 | 2021-10-29 | 杨世斌 | 一种物联网资源数据分析方法 |
CN113569965A (zh) * | 2021-07-30 | 2021-10-29 | 杨世斌 | 一种基于物联网的用户行为分析方法及系统 |
CN115062227A (zh) * | 2022-07-06 | 2022-09-16 | 南宁睿普软件有限公司 | 采用人工智能分析的用户行为活动分析方法及大数据系统 |
CN115098705A (zh) * | 2022-08-25 | 2022-09-23 | 成都航空职业技术学院 | 基于知识图谱推理的网络安全事件分析方法及系统 |
-
2022
- 2022-10-13 CN CN202211254667.5A patent/CN115828011B/zh active Active
Patent Citations (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN104598557A (zh) * | 2015-01-05 | 2015-05-06 | 华为技术有限公司 | 数据栅格化、用户行为分析的方法和装置 |
CN106789136A (zh) * | 2015-11-19 | 2017-05-31 | 北大方正集团有限公司 | 基于用户行为的运营分析实现方法及装置 |
US20170148043A1 (en) * | 2015-11-23 | 2017-05-25 | Institute For Information Industry | Location based community integration matchmaking system, method and computer readable recording media for optimizing sales |
US20180033023A1 (en) * | 2016-07-28 | 2018-02-01 | Mastercard International Incorporated | Systems and methods for characterizing geographic regions |
CN113449012A (zh) * | 2021-06-20 | 2021-09-28 | 卢洪亮 | 基于大数据预测的互联网服务挖掘方法及大数据预测系统 |
CN113568952A (zh) * | 2021-07-30 | 2021-10-29 | 杨世斌 | 一种物联网资源数据分析方法 |
CN113569965A (zh) * | 2021-07-30 | 2021-10-29 | 杨世斌 | 一种基于物联网的用户行为分析方法及系统 |
CN113468432A (zh) * | 2021-08-02 | 2021-10-01 | 东莞市汇学汇玩教育科技有限公司 | 基于移动互联网的用户行为大数据分析方法及系统 |
CN113468604A (zh) * | 2021-08-02 | 2021-10-01 | 东莞市慧学慧玩教育科技有限公司 | 基于人工智能的大数据隐私信息解析方法及系统 |
CN115062227A (zh) * | 2022-07-06 | 2022-09-16 | 南宁睿普软件有限公司 | 采用人工智能分析的用户行为活动分析方法及大数据系统 |
CN115098705A (zh) * | 2022-08-25 | 2022-09-23 | 成都航空职业技术学院 | 基于知识图谱推理的网络安全事件分析方法及系统 |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN117176547A (zh) * | 2023-08-17 | 2023-12-05 | 鸿图百奥科技(广州)有限公司 | 一种通信设备的管控方法及系统 |
Also Published As
Publication number | Publication date |
---|---|
CN115828011B (zh) | 2023-11-10 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112052787B (zh) | 基于人工智能的目标检测方法、装置及电子设备 | |
US10484413B2 (en) | System and a method for detecting anomalous activities in a blockchain network | |
CN107633444B (zh) | 基于信息熵与模糊c均值聚类的推荐系统噪声过滤方法 | |
CN111563192B (zh) | 实体对齐方法、装置、电子设备及存储介质 | |
CN103455542A (zh) | 多类识别器以及多类识别方法 | |
CN115828160A (zh) | 基于大数据和云计算的数据挖掘方法和平台 | |
CN109300041A (zh) | 理财策略推荐方法、电子装置及可读存储介质 | |
CN115828011B (zh) | 基于大数据的数据分析方法和平台 | |
CN115545103A (zh) | 异常数据识别、标签识别方法和异常数据识别装置 | |
KR102057622B1 (ko) | 콘텐츠 관리 시스템 | |
CN114780606A (zh) | 一种大数据挖掘方法及系统 | |
CN113742580A (zh) | 目标类型数据的召回方法、装置、电子设备及存储介质 | |
US20240078473A1 (en) | Systems and methods for end-to-end machine learning with automated machine learning explainable artificial intelligence | |
CN112115359B (zh) | 一种基于多阶近邻预测的推荐系统及方法 | |
CN113821657A (zh) | 基于人工智能的图像处理模型训练方法及图像处理方法 | |
CN115564578B (zh) | 欺诈识别模型生成方法 | |
JP2004192555A (ja) | 情報管理方法、情報管理装置及び情報管理プログラム | |
CN115082999A (zh) | 合影图像人物分析方法、装置、计算机设备和存储介质 | |
CN110275986B (zh) | 基于协同过滤的视频推荐方法、服务器及计算机存储介质 | |
CN114329231A (zh) | 对象特征处理方法、装置、电子设备及存储介质 | |
CN115455276A (zh) | 推荐对象的方法、装置、计算机设备和存储介质 | |
CN113283484A (zh) | 改进的特征选择方法、装置及存储介质 | |
CN111882416A (zh) | 一种风险预测模型的训练方法和相关装置 | |
Haley et al. | Cluster analysis of deep embeddings in real-time strategy games | |
CN110990453B (zh) | 数据集中强相关变量提取及专利数量影响因素提取方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
TA01 | Transfer of patent application right | ||
TA01 | Transfer of patent application right |
Effective date of registration: 20231017 Address after: Room 1209, Floor 12, Unit 3, Building 3, No. 1700, North Tianfu Avenue, Chengdu Hi tech Zone, China (Sichuan) Pilot Free Trade Zone, 610000, Sichuan Applicant after: Sichuan Hongzhi Kexin Digital Technology Co.,Ltd. Address before: Room 705, Wenfeng Building, No. 246 Jiefang Road, Yunlong District, Xuzhou City, Jiangsu Province, 221000 Applicant before: Xuzhou Hai Qing Mdt InfoTech Ltd. |
|
GR01 | Patent grant | ||
GR01 | Patent grant |