发明内容
有鉴于此,本申请实施例提供一种基于互联网的电子商务数据处理方法及系统,至少部分解决现有技术中存在的问题。
本发明的目的可以通过以下技术方案实现:
一种基于互联网的电子商务数据处理方法,包括:
获取待处理的电子商务数据;
根据所述电子商务数据进行分类,并按照分类结果为每个电子商务数据添加类别标签;
根据所述电子商务数据的类别标签进行区分存储,并对电子商务数据进行关联性标记;
获取互联网内历史电子商务数据以及对应的关联性标记;
将关联性匹配成功的电子商务数据与对应的历史电子商务数据发送至数据处理平台进行数据处理。
进一步地,所述电子商务数据进行分类包括:
获取电子商务数据的底层权限,并将电子商务数据的底层权限内拓展名开启;获取电子商务数据对应的拓展名,并与标签词典进行比对;
将标签词典内与电子商务数据对应的拓展名相同的数据标记为分类结果。
进一步地,所述并按照分类结果为每个电子商务数据添加类别标签包括:
获取分类结果,并提取分类结果内的类型数据,并将类型数据标记为对应电子商务数据的类别标签。
进一步地,根据所述电子商务数据的类别标签进行区分存储,并对电子商务数据进行关联性标记包括:
将类别标签相同的电子商务数据存储在对应的转存服务器内;
所述关联性标记包括:
获取产生电子商务数据的设备编码与注册账户账号,提取设备编码与注册账户账号内的数值,依次排序设备编码内的数值生成第一值;依次排序账户账号内的数值生成第二值;
通过CAD软件建立平面坐标系,并绘制原点为圆心第一值与第二值为半径的同心圆;
将所述同心圆标记为电子商务数据的关联性标记。
进一步地,所述分类结果包括预设拓展名与类型数据;
所述类型数据包括文本类型、视频类型、音频类型以及图片类型;
所述转存服务器包括文本转存服务器、视频转存服务器、音频转存服务器以及图片转存服务器。
进一步地,所述电子商务数据包括文本数据、视频数据、音频数据以及图片数据。
一种基于互联网的电子商务数据处理系统,包括:
数据采集模块,设置为获取待处理的电子商务数据;
数据分类模块,设置为根据所述电子商务数据进行分类;
标签生成模块,设置为按照分类结果为每个电子商务数据添加类别标签;
关联性模块,设置为电子商务数据关联性标记。
进一步地,所述关联性模块包括设备编码采集单元与注册账户账号采集单元;
所述设备编码采集单元用于采集产生电子商务数据的设备对应的设备编码;
所述注册账户账号采集单元用于采集产生电子商务数据的注册账户账号。
进一步地,还包括历史数据查询模块,所述历史数据查询模块用于获取互联网内历史电子商务数据以及对应的关联性标记。
一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如前所述的方法的步骤。
与现有技术相比,本发明的有益效果是:
(1)获取待处理的电子商务数据;根据电子商务数据进行分类,并按照分类结果为每个电子商务数据添加类别标签;根据电子商务数据的类别标签进行区分存储,并对电子商务数据进行关联性标记;获取互联网内历史电子商务数据以及对应的关联性标记;将关联性匹配成功的电子商务数据与对应的历史电子商务数据发送至数据处理平台进行数据处理,通过对历史电子商务数据进行匹配对新产生的电子商务数据进行历史记录支持,方便数据处理平台进行深度的数据挖掘与处理,同时整个方法采用分布式框架,进而提高海量数据的处理能力。
(2)通过CAD软件建立平面坐标系,并绘制原点为圆心第一值与第二值为半径的同心圆;将同心圆标记为电子商务数据的关联性标记,使得本发明更方便的对数据进行了标记处理,进而提高海量数据的处理能力,降低运算的能耗。
(3)选取第一值对应圆相同,第二值对应圆不相同的历史电子商务数据为亲友历史电子商务数据;此时不进行数据融合;选取第二值对应圆相同,第一值对应圆不相同的历史电子商务数据为备用机历史电子商务数据,并获取第二值对应的历史电子商务数据,进行数据融合;选取第一值对应圆相同,第二值对应圆相同的历史电子商务数据为本人历史电子商务数据,并获取第一值与第二值对应的历史电子商务数据,进行数据融合;大大增加了数据筛选的范围,并且通过设置不同的筛选指令,进而可以对用户以及用户的家人进行数据分析,提升数据分析质量。
具体实施方式
为使本发明实施方式的目的、技术方案和优点更加清楚,下面将结合本发明实施方式中的附图,对本发明实施方式中的技术方案进行清楚、完整地描述,显然,所描述的实施方式是本发明一部分实施方式,而不是全部的实施方式。基于本发明中的实施方式,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施方式,都属于本发明保护的范围。
因此,在下述附图中提供的本发明的实施方式的详细描述并非旨在限制要求保护的本发明的范围,而是仅仅表示本发明的选定实施方式。
如图1所示,一种基于互联网的电子商务数据处理方法,包括:
获取待处理的电子商务数据;
根据电子商务数据进行分类,并按照分类结果为每个电子商务数据添加类别标签;
根据电子商务数据的类别标签进行区分存储,并对电子商务数据进行关联性标记;
获取互联网内历史电子商务数据以及对应的关联性标记;
将关联性匹配成功的电子商务数据与对应的历史电子商务数据发送至数据处理平台进行数据处理。
本公开提供的电子商务数据处理方法可以通过对历史电子商务数据进行匹配对新产生的电子商务数据进行历史记录支持,方便数据处理平台进行深度的数据挖掘与处理,同时整个方法采用分布式框架,进而提高海量数据的处理能力;
下面对电子商务数据处理方法进行详细说明。
具体的,电子商务数据包括文本数据、视频数据、音频数据以及图片数据,电子商务数据可以为用户操作手机进行搜索、点击、浏览以及互动所产生的数据。
电子商务数据进行分类包括:
获取电子商务数据的底层权限,并将电子商务数据的底层权限内拓展名开启;获取电子商务数据对应的拓展名,并与标签词典进行比对;
将标签词典内与电子商务数据对应的拓展名相同的数据标记为分类结果,具体的,分类结果包括预设拓展名与类型数据;
在具体实施中,通过文本识别软件对电子商务数据对应的拓展名进行文本识别,并将识别文本标记为第一文本;
具体的,拓展名包括文本拓展名、视频拓展名、音频拓展名以及图片拓展名;
其中,文本拓展名对应的文本为ASCII、MIME、.txt中任一项;
视频拓展名对应的文本为wmv、asf、asx、rm、rmvb、mp4、3gp、mov、m4v、avi、dat、mkv、flv、vob中的任一项;
音频拓展名对应的文本为Wave、AIFF、Audio、MPEG、RealAudio、MIDI中的任一项;
图片拓展名对应的文本为JPEG、TIFF、RAW、BMP、GIF、PNG中的任一项;
标签词典为存储有文本拓展名、视频拓展名、音频拓展名以及图片拓展名的数据库。
通过卷积神经网络将第一文本与标签词典进行对比,得出分类结果。
具体的,获取分类结果,并提取分类结果内的类型数据,并将类型数据标记为对应电子商务数据的类别标签。
其中,类型数据为文本类型、视频类型、音频类型以及图片类型,具体对应的类别标签为文本标签、视频标签、音频标签以及图片标签;
具体的,将类别标签相同的电子商务数据存储在对应的转存服务器内;
转存服务器包括文本转存服务器、视频转存服务器、音频转存服务器以及图片转存服务器。
具体的,文本转存服务器用于存储文本标签对应的电子商务数据,视频转存服务器用于存储视频标签对应的电子商务数据,音频转存服务器用于存储音频标签对应的电子商务数据,图片转存服务器用于存储图片标签对应的电子商务数据。
关联性标记包括:
获取产生电子商务数据的设备编码与注册账户账号,提取设备编码与注册账户账号内的数值,依次排序设备编码内的数值生成第一值;依次排序账户账号内的数值生成第二值;
在本发明具体实施中,设备编码为产生电子商务数据对应设备的手机卡号码;注册账户账号为产生电子商务数据对应软件的身份编码;
需要注意的是,手机卡号码与身份编码均为纯数字组合;
例如设备编码为18888888888,对应的第一值即为18888888888;
例如注册账户账号为12345678,对应的第二值即为12345678;
在本公开具体实施中,设备编码与注册账户账号均为现实情况产生,在此,本发明不做具体限定。
通过CAD软件建立平面坐标系,并绘制原点为圆心,第一值与第二值为半径的同心圆;
将同心圆标记为电子商务数据的关联性标记。
通过在互联网中查询历史的电子商务数据以及对应的关联性标记,进而获取得到电子商务数据对应的历史电子商务数据,方便数据处理平台进行数据处理;
在具体实施中,通过电子商务数据的同心圆以及历史电子商务数据的同心圆比较;
选取第一值对应圆相同,第二值对应圆不相同的历史电子商务数据为亲友历史电子商务数据;此时不进行数据融合;
选取第二值对应圆相同,第一值对应圆不相同的历史电子商务数据为备用机历史电子商务数据,并获取第二值对应的历史电子商务数据,进行数据融合;
选取第一值对应圆相同,第二值对应圆相同的历史电子商务数据为本人历史电子商务数据,并获取第一值与第二值对应的历史电子商务数据,进行数据融合;
如图2所示,一种基于互联网的电子商务数据处理系统,包括:
数据采集模块,设置为获取待处理的电子商务数据;
数据分类模块,设置为根据电子商务数据进行分类;
标签生成模块,设置为按照分类结果为每个电子商务数据添加类别标签;
关联性模块,设置为电子商务数据关联性标记。
关联性模块包括设备编码采集单元与注册账户账号采集单元;
设备编码采集单元用于采集产生电子商务数据的设备对应的设备编码;
注册账户账号采集单元用于采集产生电子商务数据的注册账户账号。
还包括历史数据查询模块,历史数据查询模块用于获取互联网内历史电子商务数据以及对应的关联性标记。
一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如前所示的方法的步骤。
上述公式均是去量纲取其数值计算,公式是由采集大量数据进行软件模拟得到最近真实情况的一个公式,公式中的预设参数由本领域的技术人员根据实际情况进行设置。
在本发明所提供的实施例中,应该理解到,所揭露的设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式;所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方法的目的。
另对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方法而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方法进行修改或等同替换,而不脱离本发明技术方法的精神和范围。