发明内容
基于上述提及的问题,第一方面,本发明实施例提供一种适于电子商务的业务操作行为大数据挖掘方法,包括:
获取电商服务平台的目标业务对象在设定历史周期内对电商服务平台所提供的所述电商业务项目进行操作而得到的电商业务大数据集,所述电商业务大数据集包括根据时序排列的多个操作行为数据;
对所述电商业务大数据集中各操作行为数据依次进行遍历,在每次遍历过程中获取一个当前操作行为数据作为第一操作行为数据,并获取所述当前操作行为数据之后产生的一个操作行为数据作为第二操作行为数据;
获取待进行电商行为大数据分析的目标操作行为单元对应的行为单元关键标识;
根据所述行为单元关键标识对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析,以对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。
在第一方面的一种实施方式中,所述根据所述行为单元关键标识对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析,以对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘,包括:
根据所述行为单元关键标识,对所述第一操作行为数据和所述第二操作行为数据分别进行行为特征挖掘,得到所述第一操作行为数据的第一操作行为特征向量和所述第二操作行为数据的第二操作行为特征向量,所述第一操作行为特征向量至少包括所述第一操作行为数据所对应的操作行为单元与所述行为单元关键标识之间的相关性量化参数,所述第二操作行为特征向量至少包括所述第二操作行为数据所对应的操作行为单元与所述行为单元关键标识之间的相关性量化参数;
对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量;
根据所述融合行为特征向量对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。
在第一方面的一种实施方式中,根据所述行为单元关键标识,对所述第一操作行为数据进行行为特征挖掘,得到所述第一操作行为数据的第一操作行为特征向量,包括:
对所述行为单元关键标识进行信息解析,得到所述行为单元关键标识的标识信息;
对所述第一操作行为数据中的多个行为数据片段进行分量提取,得到所述多个行为数据片段的数据片段描述分量;
基于所述标识信息和所述多个行为数据片段的数据片段描述分量,确定所述多个行为数据片段的片段重要性参数,其中,所述行为数据片段的片段重要性参数表示所述行为数据片段与所述行为单元关键标识之间的相关性程度;
基于所述多个行为数据片段的片段重要性参数,对所述多个行为数据片段的数据片段描述分量进行分量融合,得到所述第一操作行为特征向量;
其中,所述基于所述标识信息和所述多个行为数据片段的数据片段描述分量,确定所述多个行为数据片段的片段重要性参数,包括:
分别获取所述标识信息与多个数据片段描述分量之间的第一共性量化值;
对获取到的各个第一共性量化值进行参数标准化处理,得到各所述行为数据片段的片段重要性参数。
在第一方面的一种实施方式中,所述第二操作行为数据包括两个或两个以上,所述对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量,包括:
根据所述第一操作行为特征向量与多个第二操作行为特征向量之间的第二共性量化值,从所述多个第二操作行为数据中筛选所述第二共性量化值最大的所述第二操作行为数据,所述第二共性量化值是用于描述所述第二操作行为数据所对应的操作行为单元与所述第一操作行为数据所对应的操作行为单元之间的关联程度的量化值;
将所述第一操作行为特征向量和筛选的所述第二操作行为数据的第二操作行为特征向量进行特征向量融合,得到所述融合行为特征向量。
在第一方面的一种实施方式中,所述对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量之后,所述方法还包括:
对所述融合行为特征向量进行特征聚类处理,得到所述第一操作行为数据与所述行为单元关键标识之间的匹配性量化值;
在所述匹配性量化值达到预设匹配性量化值时,从所述第一操作行为数据中,获取与所述行为单元关键标识匹配的行为数据片段,所述行为单元关键标识与所述行为数据片段匹配表示所述行为数据片段所对应的操作行为单元与所述行为单元关键标识匹配;
其中,所述在所述匹配性量化值达到预设匹配性量化值时,从所述第一操作行为数据中,获取与所述行为单元关键标识匹配的行为数据片段,包括:
在所述匹配性量化值达到所述预设匹配性量化值时,根据所述第一操作行为数据中多个行为数据片段的片段重要性参数,从所述第一操作行为数据中筛选对应的片段重要性参数达到预设重要性参数值的多个目标行为数据片段,其中,所述行为数据片段的片段重要性参数表征所述行为数据片段与所述行为单元关键标识之间的相关性程度;
确定所述多个目标行为数据片段在所述第一操作行为数据中的初始数据片段和终止数据片段;
基于所述多个目标行为数据片段的初始数据片段和终止数据片段,从所述第一操作行为数据中采集包括至少一个目标行为数据片段的行为数据片段;
在对所述融合行为特征向量进行特征聚类处理,得到所述第一操作行为数据与所述行为单元关键标识之间的匹配性量化值之后,所述方法还包括:
在所述匹配性量化值未达到所述预设匹配性量化值时,从多个不同的待定行为单元关键标识中获取与所述行为单元关键标识不同的其它行为单元关键标识,返回根据所述行为单元关键标识对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析的步骤,以进行下一个操作行为单元对应的操作行为数据挖掘的过程。
在第一方面的一种实施方式中,所述根据所述行为单元关键标识,对所述第一操作行为数据和所述第二操作行为数据分别进行行为特征挖掘,得到所述第一操作行为数据的第一操作行为特征向量和所述第二操作行为数据的第二操作行为特征向量,包括:
基于预设的行为特征挖掘网络的行为特征挖掘层,根据所述行为单元关键标识,对所述第一操作行为数据和所述第二操作行为数据分别进行行为特征挖掘,得到所述第一操作行为特征向量和所述第二操作行为特征向量;
所述对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量,包括:
基于所述行为特征挖掘网络的特征全连接层,对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量;
其中,所述行为特征挖掘层包括第一卷积核、第二卷积核和分量融合单元;基于所述行为特征挖掘层,根据所述行为单元关键标识,对所述第一操作行为数据进行行为特征挖掘,得到所述第一操作行为特征向量,包括:
基于所述第一卷积核,对所述行为单元关键标识进行信息解析,得到所述行为单元关键标识的标识信息;
基于所述第二卷积核,对所述第一操作行为数据中的多个行为数据片段进行分量提取,得到所述多个行为数据片段的数据片段描述分量;
基于所述分量融合单元,对所述标识信息和所述多个行为数据片段的数据片段描述分量进行处理,确定所述多个行为数据片段的片段重要性参数,所述行为数据片段的片段重要性参数为表示所述行为数据片段与所述行为单元关键标识之间的相关性程度的量化参数;
基于所述分量融合单元,根据所述多个行为数据片段的片段重要性参数,对所述多个行为数据片段的数据片段描述分量进行分量融合,得到所述第一操作行为特征向量。
在第一方面的一种实施方式中,还包括对所述行为特征挖掘网络进行训练的步骤,该步骤包括:
获取第一参考操作行为数据、第二参考操作行为数据和所述第一参考操作行为数据对应的参考行为单元关键标识,所述第二参考操作行为数据产生于所述第一参考操作行为数据之后,所述第一参考操作行为数据所对应的操作行为单元与所述参考行为单元关键标识对应,所述第一参考操作行为数据和所述第二参考操作行为数据中各自具有参考操作信息和针对所述参考操作信息的参考操作结果信息;
基于所述行为特征挖掘网络,对所述第一参考操作行为数据、所述第二参考操作行为数据和所述参考行为单元关键标识进行处理,得到所述第一参考操作行为数据的参考行为特征向量;
基于所述参考行为特征向量和所述参考行为单元关键标识,对所述行为特征挖掘网络进行模型训练。
在第一方面的一种实施方式中,所述基于所述特征全连接层,对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量之后,所述方法还包括:
基于预先训练得到的行为分析网络的特征聚类层,对所述融合行为特征向量进行特征聚类处理,得到所述第一操作行为数据与所述行为单元关键标识之间的匹配性量化值;
基于所述行为分析网络的数据采集层,在所述匹配性量化值达到预设匹配性量化值时,从所述第一操作行为数据中,获取与所述行为单元关键标识匹配的行为数据片段;
其中,所述行为特征挖掘网络和所述行为分析网络通过以下步骤进行训练得到:
获取第一参考操作行为数据、第二参考操作行为数据、所述第一参考操作行为数据对应的参考行为单元关键标识和所述第一参考操作行为数据中的参考行为数据片段,所述第二参考操作行为数据产生于所述第一参考操作行为数据之后,所述参考行为数据片段所对应的操作行为单元与所述参考行为单元关键标识对应,所述第一参考操作行为数据和所述第二参考操作行为数据中各自具有参考操作信息和针对所述参考操作信息的参考操作结果信息; 基于所述行为特征挖掘网络,对所述第一参考操作行为数据、所述第二参考操作行为数据和所述参考行为单元关键标识进行处理,得到所述第一参考操作行为数据的行为特征向量;
基于所述行为分析网络,对所述行为特征向量、所述第一参考操作行为数据和所述参考行为单元关键标识进行处理,得到预测行为数据片段;
根据所述预测行为数据片段和所述参考行为数据片段,对所述行为特征挖掘网络和所述行为分析网络进行网络训练。
在第一方面的一种实施方式中,所述根据所述融合行为特征向量对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘,包括:
根据所述融合行为特征向量中所包括的与所述行为单元关键标识之间的相关性量化参数将相关性量化参数达到预设参数阈值的第一操作行为数据以及第二操作行为数据进行数据整合得到操作行为数据组合,将该操作行为数据组合作为待定操作行为数据组合;
将所有得到的待定操作行为数据组合根据对应的相关性量化参数依序加入一设定的数据库中,得到挖掘的操作行为数据集。
第二方面,本发明实施例还提供一种适于电子商务的业务操作行为大数据挖掘系统,包括处理器、机器可读存储介质,所述机器可读存储介质和所述处理器连接,所述机器可读存储介质用于存储程序、指令或代码,所述处理器用于执行所述机器可读存储介质中的程序、指令或代码,以实现上述的方法。
综上所述,本发明实施例提供的本发明实施例提供的适于电子商务的业务操作行为大数据挖掘方法及系统,通过对获取的电商业务大数据集中各操作行为数据依次进行遍历,在每次遍历过程中获取一个当前操作行为数据作为第一操作行为数据,并获取所述当前操作行为数据之后产生的一个操作行为数据作为第二操作行为数据;然后,结合待进行电商行为大数据分析的目标操作行为单元对应的行为单元关键标识,对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析,实现针对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。如此,可以针对每次遍历的第一操作行为数据和第二操作行为数据分别与对应的行为单元关键标识之间的关联性实现对所述各所述电商业务项目的操作行为单元进行操作行为数据挖掘的目的。
此外,将第一操作行为数据之后的第二操作行为数据的第二操作行为特征向量,融合到第一操作行为数据的第一操作行为特征向量中,使得到的第一操作行为数据的融合行为特征向量中不仅包括第一操作行为数据所对应的操作行为单元的相关特征信息,还包括之后生成的第二操作行为数据所对应的操作行为单元的相关特征信息,进而使得得到的融合行为特征向量更够更全面、更完善、以及更精准的对操作行为单元的相关联的信息进行表达。同时,由于操作行为特征向量是基于标识信息而获得,该操作行为特征向量可以进一步表达操作行为数据中所描述的操作行为单元与行为单元关键标识所指示的操作行为单元的相关性量化参数,有利于后期的相关分析和应用。
进一步地,通过上述方式,以至少两个操作行为数据为组进行的操作行为数据挖掘,相较于针对每个操作行为数据单独进行行为特征的分析和挖掘而得到挖掘结果,更多的考虑了相邻两个操作行为之间在时序上的行为关联性,由于数据源包含了时序上的行为关联特征,如此挖掘得到的数据源在后续进行大数据应用时(如进行业务对象的业务画像分析),可以提升数据与的应用维度及范围。例如,可进一步用于进行行为趋势及倾向预测等,进而加强数据挖掘的的深度和广度,可有效提升挖掘得到的数据源在后续的应用效果。
具体实施方式
请参阅图1,是本发明实施例提供的适于电子商务的业务操作行为大数据挖掘方法的流程示意图。首先,先对实现所述适于电子商务的业务操作行为大数据挖掘方法的硬件环境进行说明。如图2所示,所述方法可以由计算机设备100执行并实现。在一种可能的实施方式中,所述计算机设备100可以是个人电脑、服务器、用于提供电子商务服务的电商服务平台的后台服务中心。优选地,本实施例以所述计算机设备100为服务器为例,该服务器可以是一个独立的服务器,也可以是由多个服务器构成的服务器集群、云服务器、远端服务器中心等。
进一步地,参照图2所示,所述计算机设备100可以包括存储器110、处理器120、通信总线130和业务操作行为大数据挖掘系统140。本实施例中,所述存储器110、处理器120和通信总线130彼此之间可以直接或间接地电性连接,以实现数据的传输或交互。例如,这些元件互相之间可以通过一条或多条所述通信总线130实现电性连接。所述存储器110可以是任何类型的存储单元,例如,本实施例优选为一种非易失性的机器可读存储介质。所述存储器110中存储用于存储各种类型的程序、指令或可执行代码,例如所述业务操作行为大数据挖掘系统140所包括的各种软件功能模块对应的软件程序部分。其中,所述业务操作行为大数据挖掘系统140可以包括至少一个以软件或固件(firmware)的形式储存于所述存储器110中的软件功能模块,所述处理器120通过运行存储在存储器110内的软件程序以及模块,例如本申请实施例中的业务操作行为大数据挖掘系统140中的软件程序以及模块,从而实现所述计算机设备100的各种功能应用以及数据处理,例如实现本申请实施例中的业务画像分析方法。
其中,所述存储器110可以是,但不限于,随机存取存储器(Random AccessMemory,RAM),只读存储器(Read Only Memory,ROM),可编程只读存储器(ProgrammableRead-Only Memory,PROM),可擦除只读存储器(Erasable Programmable Read-OnlyMemory,EPROM),电可擦除只读存储器(Electric Erasable Programmable Read-OnlyMemory,EEPROM)等。所述处理器120可能是一种集成电路芯片,具有数据的处理能力。上述的处理器120可以是通用处理器,包括中央处理器 (Central Processing Unit,CPU)、网络处理器 (Network Processor,NP)等,用于实现或者执行本申请实施例中公开的各方法、步骤及逻辑框图。
进一步地,所述通信总线130可用于实现计算机设备100各组件相互之间的通信连接,也可以实现计算机设备100内部的各通信组件与外部通信设备之间的通信连接,进而实现网络信号及数据的收发操作。
下面对图1所示的适于电子商务的业务操作行为大数据挖掘方法所包括的各个步骤通过示例的方式进行详细的介绍。可选地,所述方法可以包括下述S101-S103所述的各步骤。
步骤S101,获取电商服务平台的目标业务对象在设定历史周期内对电商服务平台所提供的电商业务项目进行操作而得到的电商业务大数据集,所述电商业务大数据集包括根据时序排列的多个操作行为数据。
本实施例中,所述电商业务大数据及中的各所述操作行为数据可以是一个完整操作行为对应的操作行为数据也可以是一个完整操作行为所包括的不同离散操作对应的操作行为数据。优选地,本实施例可以是一个完整的操作行为对应的操作行为数据,例如,针对不同的电商业务项目而进行的点击、浏览、收藏、分享、加入订单、付款、复购等操作而对应的操作行为数据。
步骤S102,对所述电商业务大数据集中各操作行为数据依次进行遍历,在每次遍历过程中获取一个当前操作行为数据作为第一操作行为数据,并获取所述当前操作行为数据之后产生的一个操作行为数据作为第二操作行为数据。
例如,作为一种可能的示例,所述电商业务大数据集可以表示为:{Data-1、Data-2、Data-3、....、Data-i、....Data-n}。也即,所述电商业务大数据集可以包括Data-1至Data-n等多个操作行为数据。那么,在第一次进行数据遍历时,可以将Data-1作为第一操作行为数据,Data-2作为第二操作行为数据;在第二次进行数据遍历时,可以将Data-2作为第一操作行为数据,将Data-3作为第二操作行为数据;在第i次进行数据遍历时,可以将Data-i作为第一操作行为数据,将Data-i+1作为第二操作行为数据,以此类推,将前后相邻的两个操作行为数据成对进行遍历,以进行后续的数据分析,其中i小于或等于n-1。
又例如,作为另一种示例,所述第二操作行为数据也可以是多个,例如,以每次遍历包括两个第二操作行为数据为例,在第一次进行数据遍历时,可以将Data-1作为第一操作行为数据,Data-2以及Data-3作为第二操作行为数据;在第二次进行数据遍历时,可以将Data-2作为第一操作行为数据,将Data-3以及Data-4作为第二操作行为数据;在第i次进行数据遍历时,可以将Data-i作为第一操作行为数据,将Data-i+1以及Data-i+2作为第二操作行为数据,以此类推,将前后相邻的三个操作行为数据成组进行遍历,以进行后续的数据分析,其中i小于或等与n-2。
进一步地,本实施例中,所述第一操作行为数据和所述第二操作行为数据中各自具有针对电商业务项目的操作信息和针对所述操作信息的操作结果信息。其中,操作信息可以是针对操作行为单元的有关操作进行表述的相关信息,操作结果信息是用于描述操作行为单元的相关操作的结果信息,例如操作进度、具体操作结果、操作有关的对象(如分享对象、订单对象)等等,同时,操作行为数据中包括与操作行为单元的操作行为数据有关的至少一个行为数据片段。
步骤S103,获取待进行电商行为大数据分析的目标操作行为单元对应的行为单元关键标识。
本实施例中,在一次数据挖掘的过程中,可以是针对一个操作行为单元的操作行为数据进行挖掘,挖掘出与该对用的操作行为单元有关的操作行为数据,例如,所述行为单元关键标识可以是与上述的点击、浏览、收藏、分享、加入订单、付款、复购等操作行为单元分别对应的预先设定的行为单元关键标识,其可以是预先设置的与不同的操作行为单元有关的单元ID,具体不进行限定。
步骤S104,根据所述行为单元关键标识对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析,以对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。
例如,本实施例中,如图3所示,针对步骤S104,根据所述行为单元关键标识对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析,以实现对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘的方式,可以包括下述的S141-S143的步骤,示例性介绍如下。
步骤S141,根据所述行为单元关键标识,对所述第一操作行为数据和所述第二操作行为数据分别进行行为特征挖掘,得到所述第一操作行为数据的第一操作行为特征向量和所述第二操作行为数据的第二操作行为特征向量。
本实施例中所述第一操作行为特征向量至少包括所述第一操作行为数据所对应的操作行为单元与所述行为单元关键标识之间的相关性量化参数,所述第二操作行为特征向量至少包括所述第二操作行为数据所对应的操作行为单元与所述行为单元关键标识之间的相关性量化参数。
其中,第一操作行为数据的第一操作行为特征向量可以包括第一操作行为数据中所描述的操作行为单元的相关属性信息,第二操作行为数据的第二操作行为特征向量可以包括第二操作行为数据中所描述的操作行为单元的相关属性信息,第一操作行为特征向量还可以包括第一操作行为数据所对应的操作行为单元与行为单元关键标识之间的相关性量化参数,第二操作行为特征向量也可以包括第二操作行为数据所对应的操作行为单元与行为单元关键标识之间的相关性量化参数。
基于此,根据行为单元关键标识对第一操作行为数据进行行为特征挖掘,使挖掘到的第一操作行为特征向量中融入了行为单元关键标识的标识信息,同时,根据行为单元关键标识对第二操作行为数据进行行为特征挖掘,使提取出的第二操作行为特征向量中也融入了行为单元关键标识的标识信息。
在一种可能的实现路线中,作为一种示例,如图4所示,步骤S141可以通过下述的步骤S1411-S1414的内容,具体介绍如下。
步骤S1411,对所述行为单元关键标识进行信息解析,得到所述行为单元关键标识的标识信息。
其中,行为单元关键标识的标识信息用于代表该行为单元关键标识的一种表示数据。
优选地,在一种可能的实施方式中,可以采用长短期记忆神经网络模型,例如前向长短期记忆神经网络模型或后向长短期记忆神经网络模型对所述行为单元关键标识进行信息解析。
步骤S1412,对所述第一操作行为数据中的多个行为数据片段进行分量提取,得到所述多个行为数据片段的数据片段描述分量。本实施例中,不同的行为数据片段可以分别是用于描述第一操作行为数据对应的操作行为在不同维度上的描述数据片段,例如,操作行为停留时长、操作行为对象的对象属性、操作项目的项目属性等等,具体可视实际挖掘需求而进行区分,此处不进行限定。
在一种可能的实施方式中,计算机设备可以针对操作行为数据进行划分,得到多个行为数据片段,然后分别对每个行为数据片段进行分量提取,得到每个行为数据片段的数据片段描述分量。例如,同样可以采用长短期记忆神经网络模型,例如前向长短期记忆神经网络模型或后向长短期记忆神经网络模型对所述第一操作行为数据中的多个行为数据片段进行分量提取。
本实施例中,对于行为单元关键标识,可以首先获取多个需要进行操作行为数据挖掘的多个不同的待定操作行为单元分别对应的待定行为单元关键标识,当前获取的行为单元关键标识可以是从多个待定行为单元关键标识中获取的任意一个行为单元关键标识。其中,待定行为单元关键标识中包括关键描述信息和关键描述信息对应的行为数据片段的前提下,多个待定行为单元关键标识中的关键描述信息和行为数据片段可以不同。
对于第一操作行为数据和第二操作行为数据,在一种可能实现路线中,计算机设备能够采集业务对象针对不同的电商业务项目的原始性操作行为数据,然后将采集到的原始性操作行为数据进行加工处理(如数据去噪、滤波、格式整理等)得到本实施例中可用的操作行为数据,从而得到本实施例中可以使用的第一操作行为数据和第二操作行为数据
步骤S1413,基于所述标识信息和所述多个行为数据片段的数据片段描述分量,确定所述多个行为数据片段的片段重要性参数。
其中,本实施例中,所述行为数据片段的片段重要性参数表示所述行为数据片段与所述行为单元关键标识之间的相关性程度。 其中,所述行为数据片段的片段重要性参数表示行为数据片段与行为单元关键标识之间的相关性程度的量化参数,例如,所述行为数据片段与行为单元关键标识相关性程度越高则该行为数据片段的片段重要性参数相应越大,该行为数据片段在操作行为数据中对所表达的操作行为单元的重要性程度也越高,行为数据片段与行为单元关键标识相关性程度越小则该行为数据片段的片段重要性参数也相应越小,该行为数据片段在操作行为数据中对所表达的操作行为单元的重要程度越低。
在一种可替代的实施方式中,可以首先分别获取所述标识信息与多个数据片段描述分量之间的第一共性量化值;然后,对获取到的各个第一共性量化值进行参数标准化处理,得到各所述行为数据片段的片段重要性参数。示例性地,参数标准化处理的一种可替代的方式可以是基于预先设定的参数区间,将所述第一共性量化值按照设定的参数映射方式映射到所述参数区间中,进而得到所述片段重要性参数。例如,若所述参数区间可以是0-1的区间,那么所述参数标准化处理可以是参数归一化的处理方式。
其中,其中,第一共性量化值用于描述行为数据片段与行为单元关键标识之间的相关性程度(或匹配度)的量化参数。
步骤S1414,基于所述多个行为数据片段的片段重要性参数,对所述多个行为数据片段的数据片段描述分量进行分量融合,得到所述第一操作行为特征向量。
本实施例中,在一种可能的方式中,分量融合的方式可以是现有的特征向量或特征分量的融合方式的其中任意一种或多种的组合。例如,可替代地,可以基于所述片段重要性参数对各所述行为数据片段的数据片段描述分量分别进行加权融合的方式。
步骤S142,对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量。
本实施例中,在一种可能的实施方式中,在步骤S142中,在所述第二操作行为数据包括两个或两个以上时,可以根据所述第一操作行为特征向量与多个第二操作行为特征向量之间的第二共性量化值,从所述多个第二操作行为数据中筛选所述第二共性量化值最大的所述第二操作行为数据,然后将所述第一操作行为特征向量和筛选的所述第二操作行为数据的第二操作行为特征向量进行特征向量融合,得到所述融合行为特征向量。其中,本实施例中,所述第二共性量化值是用于描述所述第二操作行为数据所对应的操作行为单元与所述第一操作行为数据所对应的操作行为单元之间的关联程度的量化值。
其中,第二共性量化值用于描述第二操作行为数据所对应的操作行为单元与第一操作行为数据所对应的操作行为单元之间的关联程度的量化值。第二操作行为数据与第一操作行为数据所对应的操作行为单元之间的关联度越高,则第二共性量化值越大。例如,两个操作行为数据都是描述“复购”这一操作行为单元的,则这两个操作行为数据之间的第二共性量化值会较大;又例如,其中一个操作行为数据是描述“分享”这一操作行为单元的,而另一个操作行为数据是描述“加入订单”这一操作行为单元的,那么该两个操作行为数据之间的第二共性量化值则会较小。
本实施例中,为了使第一操作行为特征向量中可以包括更多的与操作行为单元相关的信息,可以将第一操作行为特征向量与第二操作行为特征向量进行特征向量融合,得到第一操作行为数据的融合行为特征向量,该融合行为特征向量不仅可以包括第一操作行为数据所对应的操作行为单元的相关特征信息,还包括该第二操作行为数据中所对应的操作行为单元的相关特征信息,基于此,可以使融合行为特征向量所表达的操作行为单元的相关信息更加完善和准确。
如此,本发明实施例中,将第一操作行为数据之后的第二操作行为数据的第二操作行为特征向量,融合到第一操作行为数据的第一操作行为特征向量中,使得到的第一操作行为数据的融合行为特征向量中不仅包括第一操作行为数据所对应的操作行为单元的相关特征信息,还包括之后生成的第二操作行为数据所对应的操作行为单元的相关特征信息,进而使得得到的融合行为特征向量更够更全面、更完善、以及更精准的对操作行为单元的相关联的信息进行表达。同时,由于操作行为特征向量是基于标识信息而获得,该操作行为特征向量可以进一步表达操作行为数据中所描述的操作行为单元与行为单元关键标识所指示的操作行为单元的相关性量化参数,有利于后期的相关分析和应用。
进一步地,在所述步骤S142中对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量之后,本实施可以执行以下步骤。
(一)对所述融合行为特征向量进行特征聚类处理,得到所述第一操作行为数据与所述行为单元关键标识之间的匹配性量化值。
(二)在所述匹配性量化值达到预设匹配性量化值时,从所述第一操作行为数据中,获取与所述行为单元关键标识匹配的行为数据片段。其中,在所述匹配性量化值达到预设匹配性量化值时,标识所述行为单元关键标识与所述行为数据片段匹配以及表示所述行为数据片段所对应的操作行为单元与所述行为单元关键标识匹配。
其中,所述在所述匹配性量化值达到预设匹配性量化值时,从所述第一操作行为数据中,获取与所述行为单元关键标识匹配的行为数据片段,具体可以是:根据所述第一操作行为数据中多个行为数据片段的片段重要性参数,从所述第一操作行为数据中筛选对应的片段重要性参数达到预设重要性参数值的多个目标行为数据片段,其中,所述行为数据片段的片段重要性参数表征所述行为数据片段与所述行为单元关键标识之间的相关性程度;
确定所述多个目标行为数据片段在所述第一操作行为数据中的初始数据片段和终止数据片段;
基于所述多个目标行为数据片段的初始数据片段和终止数据片段,从所述第一操作行为数据中采集包括至少一个目标行为数据片段的行为数据片段。
在一种可能实现思路中,可以从第一操作行为数据中提取出至少一个行为数据片段,每个行为数据片段中包括至少一个目标行为数据片段。可替代地,本实施例中,可以确定多个目标行为数据片段中第一个目标行为数据片段对应的初始数据片段和最后一个目标行为数据片段对应的终止数据片段,根据第一个目标行为数据片段的初始数据片段和最后一个目标行为数据片段的终止数据片段,从第一操作行为数据中提取行为数据片段。
在上述内容的基础上,在对所述融合行为特征向量进行特征聚类处理,得到所述第一操作行为数据与所述行为单元关键标识之间的匹配性量化值之后,当所述匹配性量化值未达到所述预设匹配性量化值时,还可以从多个不同的待定行为单元关键标识中获取与所述行为单元关键标识不同的其它行为单元关键标识,返回根据所述行为单元关键标识对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析的步骤,以进行下一个操作行为单元对应的操作行为数据挖掘的过程。如此,在针对一个行为单元关键标识进行匹配完成或匹配失败时,可以进一步针对其他的行为单元关键标识对应的操作行为单元的操作行为大数据进行行为数据的挖掘。
步骤S143,根据所述融合行为特征向量对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。
例如,在一种可能的实施方式中,可以根据所述融合行为特征向量中所包括的与所述行为单元关键标识之间的相关性量化参数将相关性量化参数达到预设参数阈值的第一操作行为数据以及第二操作行为数据进行数据整合得到操作行为数据组合,将该操作行为数据组合作为待定操作行为数据组合。最后,将所有得到的待定操作行为数据组合根据对应的相关性量化参数依序加入一设定的数据库中,得到挖掘的操作行为数据集。如此,得到的操作行为数据集可以包括分别与不同的操作行为单元具有关联性的至少一个操作性行为数据组合。如此,得到的操作行为数据集,在一些典型的应用中,例如可以应用于针对不同的电商业务项目的基于频繁项集、支持度等分析的后端应用,如基于频繁项集、支持度分析的业务项目推荐或优化展示等。
在另一种可能的实现方式中针对,步骤S141以及步骤S142,还可以通过人工智能模型的方式来实现第一操作行为特征向量和第二操作行为特征向量的特征挖掘过程。示例性地,本实施例中,可以采用预先训练得到的行为特征挖掘网络实现,所述行为特征挖掘网络可以包括行为特征挖掘层和特征全连接层。
基于此,步骤S141中,根据所述行为单元关键标识,对所述第一操作行为数据和所述第二操作行为数据分别进行行为特征挖掘,得到所述第一操作行为数据的第一操作行为特征向量和所述第二操作行为数据的第二操作行为特征向量,另一种可能的实施方式可以包括:
基于预设的行为特征挖掘网络的行为特征挖掘层,根据所述行为单元关键标识,对所述第一操作行为数据和所述第二操作行为数据分别进行行为特征挖掘,得到所述第一操作行为特征向量和所述第二操作行为特征向量。
更具体地,其中,所述行为特征挖掘层还可以包括第一卷积核、第二卷积核和分量融合单元。在此基础上,基于所述行为特征挖掘层,根据所述行为单元关键标识,对所述第一操作行为数据进行行为特征挖掘,得到所述第一操作行为特征向量,可以包括以下内容:
首先,基于所述第一卷积核,对所述行为单元关键标识进行信息解析,得到所述行为单元关键标识的标识信息;
其次,基于所述第二卷积核,对所述第一操作行为数据中的多个行为数据片段进行分量提取,得到所述多个行为数据片段的数据片段描述分量;
然后,基于所述分量融合单元,对所述标识信息和所述多个行为数据片段的数据片段描述分量进行处理,确定所述多个行为数据片段的片段重要性参数;所述行为数据片段的片段重要性参数为表示所述行为数据片段与所述行为单元关键标识之间的相关性程度的量化参数;
最后,基于所述分量融合单元,根据所述多个行为数据片段的片段重要性参数,对所述多个行为数据片段的数据片段描述分量进行分量融合,得到所述第一操作行为特征向量。
相对应地,在步骤S142中,对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量,可以包括:
基于所述行为特征挖掘网络的特征全连接层,对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量。
在一种可能实现方式中,第二操作行为数据包括多个时,特征全连接层可以基于注意力机制根据第一操作行为特征向量与多个第二操作行为数据的第二操作行为特征向量之间的第二共性量化值,从多个第二操作行为数据中筛选第二共性量化值最大的第二操作行为数据,然后通过特征融合函数将第一操作行为特征向量和筛选的第二操作行为数据的第二操作行为特征向量进行特征向量融合,得到融合行为特征向量。
在一种可能的一个独立的实施方案中,本发明还可以提供一种对所述行为特征挖掘网络进行训练的方法,如图5所示,该方法可以包括下述的S510-S530的步骤,具体介绍如下。
步骤S510,获取第一参考操作行为数据、第二参考操作行为数据和所述第一参考操作行为数据对应的参考行为单元关键标识。其中,所述第二参考操作行为数据产生于所述第一参考操作行为数据之后,所述第一参考操作行为数据所对应的操作行为单元与所述参考行为单元关键标识对应,所述第一参考操作行为数据和所述第二参考操作行为数据中各自具有参考操作信息和针对所述参考操作信息的参考操作结果信息。
步骤S520,基于所述行为特征挖掘网络,对所述第一参考操作行为数据、所述第二参考操作行为数据和所述参考行为单元关键标识进行处理,得到所述第一参考操作行为数据的参考行为特征向量。
步骤S530,基于所述参考行为特征向量和所述参考行为单元关键标识,对所述行为特征挖掘网络进行模型训练。
进一步地,在一种可能的实施方式方式中,在上述基于所述特征全连接层,对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量之后,为了方便实现对所述第一操作行为数据中的多个行为数据片段进行分量提取,得到所述多个行为数据片段的数据片段描述分量,本发明实施例还可以提供一种基于人工智能的方法对所述行为数据片段进行提取的方法,例如可以基于预先训练得到的行为分析网络而实现,所述行为分析网络可以包括特征聚类层和数据采集层,示例性介绍如下。
例如,首先,可以基于预先训练得到的行为分析网络的特征聚类层,对所述融合行为特征向量进行特征聚类处理,得到所述第一操作行为数据与所述行为单元关键标识之间的匹配性量化值; 然后,基于所述行为分析网络的数据采集层,在所述匹配性量化值达到预设匹配性量化值时,从所述第一操作行为数据中,获取与所述行为单元关键标识匹配的行为数据片段。
在一种可能实现方式中,可以将对应的第一操作行为数据与行为单元关键标识之间的匹配性量化值之后,将匹配性量化值映射或转换为第一设定值或第二设定值,使得特征聚类层输出第一设定值或第二设定值。其中,第一设定值表示第一操作行为数据与行为单元关键标识匹配,第二设定值表示第一操作行为数据与行为单元关键标识不匹配。可选地,当匹配性量化值达到预设匹配性量化值时,特征聚类层可输出第一设定值,当匹配性量化值未达到预设匹配性量化值时,特征聚类层输出第二设定值。
例如,在一种可能实现方式中,在特征聚类层输出第一设定值的前提下,基于数据采集层进行后续的处理,例如可根据第一操作行为数据中多个行为数据片段的片段重要性参数,从第一操作行为数据中筛选对应的片段重要性参数达到预设片段重要性参数的多个目标行为数据片段,然后确定多个目标行为数据片段在第一操作行为数据中的初始数据片段和终止数据片段,最后基于多个目标行为数据片段的初始数据片段和终止数据片段,从第一操作行为数据中提取包括至少一个目标行为数据片段的行为数据片段。
在特征聚类层输出第二设定值的前提下,可以从多个不同的待定行为单元关键标识中获取与行为单元关键标识不同的其它行为单元关键标识,然后再重新基于行为特征挖掘网络和行为分析网络中的特征聚类层,进行下一个操作行为单元对应的操作行为数据挖掘的过程。
作为一种示例,例如,上述过程可以示例性说明如下,首先从多个待定行为单元关键标识中获取一个行为单元关键标识“Share”,并获取第一操作行为数据和多个第二操作行为数据,将获取的行为单元关键标识、第一操作行为数据和多个第二操作行为数据输入至行为特征挖掘层,基于该行为特征挖掘层,对行为单元关键标识、第一操作行为数据和多个第二操作行为数据进行处理,分别得到行为单元关键标识的标识信息、每个操作行为数据中每个行为数据片段的数据片段描述分量,再基于行为特征挖掘层通过注意力机制,对标识信息和多个数据片段描述分量进行处理,得到每个行为数据片段的片段重要性参数,再基于分量融合单元,得到每个操作行为数据的操作行为特征向量,将得到的多个操作行为特征向量输入至特征全连接层,基于该特征全连接层,对多个操作行为特征向量进行处理,从多个第二操作行为数据中筛选出一个第二操作行为数据,基于该特征全连接层,对筛选出的第二操作行为数据的第二操作行为特征向量与第一操作行为特征向量进行特征向量融合,得到第一操作行为数据的融合行为特征向量,将融合行为特征向量输入至特征聚类层,基于该特征聚类层确定第一操作行为数据所对应的操作行为单元是否与行为单元关键标识匹配,如果特征聚类层输出第一设定值,则基于数据采集层提取行为数据片段,如果输出第二设定值,则进行下一个操作行为单元对应的操作行为数据挖掘的过程。
在上述内容的基础上,本发明实施例还进一步可以提供一种可独立实施的对所述行为特征挖掘网络以及行为分析网络进行协同联合训练的方法,示例性地,具体介绍如下。
首先,获取第一参考操作行为数据、第二参考操作行为数据、所述第一参考操作行为数据对应的参考行为单元关键标识和所述第一参考操作行为数据中的参考行为数据片段。
其中,本实施例中,所述第二参考操作行为数据产生于所述第一参考操作行为数据之后,所述参考行为数据片段所对应的操作行为单元与所述参考行为单元关键标识对应,所述第一参考操作行为数据和所述第二参考操作行为数据中各自具有参考操作信息和针对所述参考操作信息的参考操作结果信息; 基于所述行为特征挖掘网络,对所述第一参考操作行为数据、所述第二参考操作行为数据和所述参考行为单元关键标识进行处理,得到所述第一参考操作行为数据的行为特征向量。
然后,基于所述行为分析网络,对所述行为特征向量、所述第一参考操作行为数据和所述参考行为单元关键标识进行处理,得到预测行为数据片段。
其次,根据所述预测行为数据片段和所述参考行为数据片段,对所述行为特征挖掘网络和所述行为分析网络进行网络训练。
综上所述,本发明实施例中,通过对获取的电商业务大数据集中各操作行为数据依次进行遍历,在每次遍历过程中获取一个当前操作行为数据作为第一操作行为数据,并获取所述当前操作行为数据之后产生的一个操作行为数据作为第二操作行为数据;然后,结合待进行电商行为大数据分析的目标操作行为单元对应的行为单元关键标识,对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析,实现针对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。如此,可以针对每次遍历的第一操作行为数据和第二操作行为数据分别与对应的行为单元关键标识之间的关联性实现对所述各所述电商业务项目的操作行为单元进行操作行为数据挖掘的目的。通过这种方式,以至少两个操作行为数据为组进行的操作行为数据挖掘,相较于针对每个操作行为数据单独进行行为特征的分析和挖掘而得到挖掘结果,更多的考虑了相邻两个操作行为之间在时序上的行为关联性,由于数据源包含了时序上的行为关联特征,如此挖掘得到的数据源在后续进行大数据应用时(如进行业务对象的业务画像分析),可以提升数据与的应用维度及范围。例如,可进一步用于进行行为趋势及倾向预测等,进而加强数据挖掘的的深度和广度,可有效提升挖掘得到的数据源在后续的应用效果。
如图6所示,是图2中的业务操作行为大数据挖掘系统140所包括的功能模块示意图。在一些其他可能的实施方式中,所述业务操作行为大数据挖掘系统140可以是所述计算机设备100本身,也可以是所述计算机设备100的处理器120,又或者可以是独立于所述计算机设备100以及所述处理器120的外部组件,本实施例对此不进行限定。
优选地,在本实施例中,所述业务操作行为大数据挖掘系统140可以包括大数据集获取模块141、行为数据遍历模块142、关键标识获取模块143、以及行为数据挖掘模块144。
大数据集获取模块141,用于获取电商服务平台的目标业务对象在设定历史周期内对电商服务平台所提供的电商业务项目进行操作而得到的电商业务大数据集,所述电商业务大数据集包括根据时序排列的多个操作行为数据。
行为数据遍历模块142,用于对所述电商业务大数据集中各操作行为数据依次进行遍历,在每次遍历过程中获取一个当前操作行为数据作为第一操作行为数据,并获取所述当前操作行为数据之后产生的一个操作行为数据作为第二操作行为数据。
关键标识获取模块143,用于获取待进行电商行为大数据分析的目标操作行为单元对应的行为单元关键标识。
行为数据挖掘模块144,用于根据所述行为单元关键标识对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析,以对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。
其中所述行为数据挖掘模块144具体用于:
根据所述行为单元关键标识,对所述第一操作行为数据和所述第二操作行为数据分别进行行为特征挖掘,得到所述第一操作行为数据的第一操作行为特征向量和所述第二操作行为数据的第二操作行为特征向量,所述第一操作行为特征向量至少包括所述第一操作行为数据所对应的操作行为单元与所述行为单元关键标识之间的相关性量化参数,所述第二操作行为特征向量至少包括所述第二操作行为数据所对应的操作行为单元与所述行为单元关键标识之间的相关性量化参数;
对所述第一操作行为特征向量和所述第二操作行为特征向量进行特征向量融合,得到所述第一操作行为数据的融合行为特征向量;
根据所述融合行为特征向量对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。
应当说明的是,所述大数据集获取模块141、行为数据遍历模块142、关键标识获取模块143、以及行为数据挖掘模块144可分别用于执行前述方法实施例中的步骤S101-S104,关于这些功能模块的更为详细的实现方法或内容可以参考对应的步骤的实施例,此处不再赘述。
综上所述,本发明实施例提供的适于电子商务的业务操作行为大数据挖掘方法及系统,通过对获取的电商业务大数据集中各操作行为数据依次进行遍历,在每次遍历过程中获取一个当前操作行为数据作为第一操作行为数据,并获取所述当前操作行为数据之后产生的一个操作行为数据作为第二操作行为数据;然后,结合待进行电商行为大数据分析的目标操作行为单元对应的行为单元关键标识,对每次遍历获取的所述第一操作行为数据和第二操作行为数据进行融合分析,实现针对所述目标业务对象针对各所述电商业务项目的操作行为单元进行操作行为数据挖掘。如此,可以针对每次遍历的第一操作行为数据和第二操作行为数据分别与对应的行为单元关键标识之间的关联性实现对所述各所述电商业务项目的操作行为单元进行操作行为数据挖掘的目的。
如此,将第一操作行为数据之后的第二操作行为数据的第二操作行为特征向量,融合到第一操作行为数据的第一操作行为特征向量中,使得到的第一操作行为数据的融合行为特征向量中不仅包括第一操作行为数据所对应的操作行为单元的相关特征信息,还包括之后生成的第二操作行为数据所对应的操作行为单元的相关特征信息,进而使得得到的融合行为特征向量更够更全面、更完善、以及更精准的对操作行为单元的相关联的信息进行表达。同时,由于操作行为特征向量是基于标识信息而获得,该操作行为特征向量可以进一步表达操作行为数据中所描述的操作行为单元与行为单元关键标识所指示的操作行为单元的相关性量化参数,有利于后期的相关分析和应用。
此外,通过上述方式,以至少两个操作行为数据为组进行的操作行为数据挖掘,相较于针对每个操作行为数据单独进行行为特征的分析和挖掘而得到挖掘结果,更多的考虑了相邻两个操作行为之间在时序上的行为关联性,由于数据源包含了时序上的行为关联特征,如此挖掘得到的数据源在后续进行大数据应用时(如进行业务对象的业务画像分析),可以提升数据与的应用维度及范围。例如,可进一步用于进行行为趋势及倾向预测等,进而加强数据挖掘的的深度和广度,可有效提升挖掘得到的数据源在后续的应用效果。
以上所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例。通常在附图中描述和示出的本发明实施例的组件可以以各种不同的配置来布置和设计。因此,在附图中提供的本发明的实施例的详细描述并非旨在限制本发明的保护范围,而仅仅是表示本发明的选定实施例。因此,本发明的保护范围应以权利要求的保护范围为准。此外,基于本发明的实施例,本领域技术人员在没有做出创造性劳动的前提下可获得的所有其它实施例,都应属于本发明保护的范围。